Gene Haur_2901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2901
Symbol
ID	5734772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3669704
End bp	3670906
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	47%
IMG OID	641280044
Product	molybdenum ABC transporter, periplasmic molybdate-binding protein
Protein accession	YP_001545667
Protein GI	159899420
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0725] ABC-type molybdate transport system, periplasmic component
TIGRFAM ID	[TIGR01256] molybdenum ABC transporter, periplasmic molybdate-binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGA TTCGTCGAAT CGGATTATTT GTGTTGAGCC TTAGTTTGTT GGCGTGTGGA 
GCCGCAACTA CCAGCGTACC AACTACCCCC GCTGCACCAA CTACCTCTAC TAACCCTACG 
CCAACCCTCA GTGGCGAGAT AAATGTATTC GCAGCTGCCT CATTGACTGG CGCATTTACT 
GAGATTGGTA ATACATTTCA GACAAGCCAT CCTAATACCA AAATCAATTT CAATTTTGCT 
GGCTCGGATC AGCTGGCAAC CCAGATTACC CAGGGTGCAC CTGCTGATGT TTTTGCTTCA 
GCCAATTCTA CACAGATGCA GGTTGCGGTT GATGCTGGTA TGATTGATGG TTCAATGCTT 
CAGCCTTTTG CTCGTAATCG CTTAATCGTA GTTTACCCTC AATCTAACCC AGCCCAAATT 
CAAAGCCTGC AAGATTTAGC CAAGCCTAAG CTGAAATTGG TATTGGCCAG TGCGAGCGTG 
CCAGTTGGCA ATTATGCCCT AGATTTTTTG GCGAAAGCCT CAGCTTTGCC CGAATTTGGT 
ACAAGCTATA GCCCAACTGT CTTGTTGAAT GTGGTTTCGT ATGAAAATAA TGTCAAAGCT 
GTTTTGAGCA AAGTTTCGTT GGGCGAGGCC GATGCAGGCA TTGTCTATAG CACTGATGCA 
GCTTCGATCA GCGATAGCAG CATTGGCACG TTGGCAATTC CTGATCAGCT GAATACGATC 
GCCACCTATC CAATTGCAAT TACCCAAAAT AGTGCCAATT CGCAACTTGC CCAAGCCTTC 
GTCGATTTTG TGTTAACTCC CGCAGGCCAA CAGATTTTGG CCCGTTATGG CTTTATTACG 
GTCACCGATC CTTCAGCATT ATCTCCTTAT CAACTATTGA TTGCTGGCAA TTTAACGACA 
CCCTTGACCC TGACCGCTGA ACTGATCGAG AACTACGAAC AACAACAAGT TGAATTCAAT 
GGTCAAAGCT ATCGTGGTTT GGGCTTTGGT CAATTGTTGA TGCAAATTCA GCCCAAGAGC 
AATGCTCGAA CATTTAGCTT GCTCAGTAGC GATGGTAGCC AAACTGTGCT GGCAATTGCC 
GACCTCACTG CCGACCCACG AGCAATTATC GCCGCCGAAG CTGATGGCAG TTTTACCAGC 
ATTATTCCGA GCAATCCGAA CGCCAGCCAG CTTAAAAACA TCGTCAAAAT TACGGTAGAA 
TGA

Protein sequence

MKQIRRIGLF VLSLSLLACG AATTSVPTTP AAPTTSTNPT PTLSGEINVF AAASLTGAFT 
EIGNTFQTSH PNTKINFNFA GSDQLATQIT QGAPADVFAS ANSTQMQVAV DAGMIDGSML 
QPFARNRLIV VYPQSNPAQI QSLQDLAKPK LKLVLASASV PVGNYALDFL AKASALPEFG 
TSYSPTVLLN VVSYENNVKA VLSKVSLGEA DAGIVYSTDA ASISDSSIGT LAIPDQLNTI 
ATYPIAITQN SANSQLAQAF VDFVLTPAGQ QILARYGFIT VTDPSALSPY QLLIAGNLTT 
PLTLTAELIE NYEQQQVEFN GQSYRGLGFG QLLMQIQPKS NARTFSLLSS DGSQTVLAIA 
DLTADPRAII AAEADGSFTS IIPSNPNASQ LKNIVKITVE