Gene Haur_2394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2394
Symbol
ID	5734275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3050631
End bp	3051644
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	52%
IMG OID	641279535
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001545162
Protein GI	159898915
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGCG CTCCCGTGCC AACGTCCTTG TCACCCCAGT CATCCGCAAG TAGTGCGGCT 
GAGCCGTTGC TCGATGTTCA GAACCTATCG GTCGAATACC AGACGTTGCG CGGCCCAGTC 
CAAGCTGTTT CCAACGTTTC GTTTAGCATC GGCCAAGGCG AGGTTTTTGG CCTTGCTGGC 
GAGTCGGGCA GCGGTAAATC GACAATTGCC CACGCAATTA TGCGGATTTT GCATTCGCCC 
GCAGTGATTA CTGGTGGCAA TGTGCTATTC GATGGCGATG ATGTGCTTGA AATGGATATG 
GAAGGCCTCG AAGCGTTCCG TTGGCGCGAT ATTTCGATGG TGTTTCAAAG CGCCATGAAT 
GCGCTCAATC CAGTTTTGAC CGTTGGCGAA CAGATTATCG ATGTGATCCA ACGCCATCAG 
CCTAAAACGA CCAAGCAACA GGCCAAAGAT CGTGCCGCCG AATTGCTTGA TATTGTGGGG 
ATCGATGGGA AGCGGGTTGA TGATTATCCG CATCAACTTT CTGGTGGTAT GCGCCAACGG 
GTGGTGATTG CGGTTGCCCT CGCACTCAAA CCACAGTTGA TGATTATGGA CGAGCCAACC 
ACCGCGCTTG ATGTGGTGGT GCAAAAAGAT ATTATGCAGC AAATCGAGTA TCTCAAAAAA 
GAGCTTGATT TCTCGATTTT GTTTATTACC CACGACTTAT CGCTGATGGT CGAGTTTTCC 
GACCGCATCG GTGTGATGTA TGCTGGCGAG ATTGTCGAAA TGACTGCTGC TCACGAGCTA 
TTCAACAAGC CTATGCATCC CTACACCCAA GGCTTGATGG CTTCGTTCCC TGCCTTGGTT 
GGCCCCAAGG AAACCCTGAC TGGGATTCCT GGTTCGCCGC CAAATATGCT CGAACCACCA 
AGCGGTTGTC GCTTTCACCC ACGCTGCCCC AAGGCGATTG CTCAGTGTTC ACTGCAACAA 
CCAACCCTAC GCGAAGTTGA ACCAGGCCAT TTTGTGGCTT GTCACTTGTA CTGA

Protein sequence

MASAPVPTSL SPQSSASSAA EPLLDVQNLS VEYQTLRGPV QAVSNVSFSI GQGEVFGLAG 
ESGSGKSTIA HAIMRILHSP AVITGGNVLF DGDDVLEMDM EGLEAFRWRD ISMVFQSAMN 
ALNPVLTVGE QIIDVIQRHQ PKTTKQQAKD RAAELLDIVG IDGKRVDDYP HQLSGGMRQR 
VVIAVALALK PQLMIMDEPT TALDVVVQKD IMQQIEYLKK ELDFSILFIT HDLSLMVEFS 
DRIGVMYAGE IVEMTAAHEL FNKPMHPYTQ GLMASFPALV GPKETLTGIP GSPPNMLEPP 
SGCRFHPRCP KAIAQCSLQQ PTLREVEPGH FVACHLY