Gene Haur_1806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1806
Symbol
ID	5733708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2099017
End bp	2100093
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	54%
IMG OID	641278949
Product	periplasmic binding protein
Protein accession	YP_001544577
Protein GI	159898330
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.455628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATCCC TTTCAGTTCG TTTTCGTTCG TTATTGGCCT TACTCGCGCT TGTGACCTTG 
GCTGCTTGTG GCTCGACTAC GGCTCCAACT GCCACCACCG CCCCAGCGGC CACCGAAGCT 
TCTGCGGCAA CCATTCCTCC AGCAGGAAGC GAAGTGCCAG CGGAAACCGA AGTACCAGCC 
GCGACCGAAG CGCCAACCGC CGAAGCAACT ACAGAAACCA GTGCTAGCGG CACACGCAGC 
ATTGAAACCC GCTATGGCAC GGTCGAAGTG CCAGCAACTC CTGCTCGGTT GGTAACGCTT 
GATGAAGGCG CATTGGATAC CGCCGTGGCC TTGGGCATTA TCCCAGTTGG TGGCATTAGC 
TCACGTTTGA GCGAAGGCGT TGCTCCCTAT ATCGCCGATA AAGTGCCTGG GATTGCGATT 
GTTGGTAACC CTGGCGAAAT CAATTTCGAA GCAGTGATTG CTGCTACCCC CGACTTGATT 
TTGACCCACA ACCGCATCGA CGAAGAAACC TACAAAAAAT TGAGCGCAAT TGCTCCAACC 
ATTGTGCCAA CCAACGGCAT TGGCGCTTGG AAGGATGCCG CTGGCGAATA TGCCGCAGCC 
TTGGGCAAAA CCAGCGAACT CGAAGCTTGG TTGAAAGAAT TCGATGCGAA AGTTGCTGAT 
GCCAAAACCA AATTGGCAAT CAAAGAAGGC ACGACTGGCG CAGTTATCCG CTGGATGCCC 
CAAGGCCCAT TGGTGATGGG TCGCTTGTTG CCAGCAGTTG TCTTGATCGA AGAATTGGGC 
TTGAGCTTGC CCCAAGTGGC GATCGATTTG GGCACTGATG CACCACACAC TGATGTTTTG 
AGCTTGGAAC AATTGGCAAC CGTTGATACC GACTGGTTGT TTGTGGCCAC GTTCAATGCT 
GAAGGTGATG GCGCTTTGGC AACCGCCCGC GAACAAGCAG CGTTTGGCCA ATTGAAGGCT 
GAAAAATCCA AGCAAGTTGT GGCGGTTAGC GCTCAACTCT GGAGCAGCGC GTTTGGTCCA 
TTGGCTGCCG ATGCAATTTT GAGCGATATT GTCGCTGGCG TTCCTGCGGC ACAATAG

Protein sequence

MTSLSVRFRS LLALLALVTL AACGSTTAPT ATTAPAATEA SAATIPPAGS EVPAETEVPA 
ATEAPTAEAT TETSASGTRS IETRYGTVEV PATPARLVTL DEGALDTAVA LGIIPVGGIS 
SRLSEGVAPY IADKVPGIAI VGNPGEINFE AVIAATPDLI LTHNRIDEET YKKLSAIAPT 
IVPTNGIGAW KDAAGEYAAA LGKTSELEAW LKEFDAKVAD AKTKLAIKEG TTGAVIRWMP 
QGPLVMGRLL PAVVLIEELG LSLPQVAIDL GTDAPHTDVL SLEQLATVDT DWLFVATFNA 
EGDGALATAR EQAAFGQLKA EKSKQVVAVS AQLWSSAFGP LAADAILSDI VAGVPAAQ