Gene Haur_2112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2112
Symbol
ID	5734000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2652376
End bp	2653368
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	50%
IMG OID	641279253
Product	ABC transporter related
Protein accession	YP_001544880
Protein GI	159898633
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1120] ABC-type cobalamin/Fe3+-siderophores transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00532716
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCAGC CAGTTTTAGC AACCGACAAC TTGAGTGTTG GCTACCACCA ACGCCGTGGT 
CAAAGCCGTA GCGTTTTGCA AAACCTCAAT TTAAGCCTTG CCAAGGGCGA ATTCGTATGT 
TTGCTTGGAG CGAATGGCGC AGGTAAATCG ACATTAATTC GTACCCTAAC CCACATGCAA 
GCGCCAATCA GCGGCAGCGT TACAATCAAT CAACAACCGC TCCATCACCT GAGCAAGGCC 
CAATTAGCCA AACAACTGAG CGTAGTACTG ACTGATCGGT TGCAAGTCAG CAATTTGACT 
GGCTATGAAC TAGTAAGCCT TGGGCGCATG CCGTATACCA ACTTGTTTGG CAGCCTCAAC 
CAACACGATC ATCAGGTAGT TCGCTGGGCT TTACATGCAA CCAACTCTGA TGATTTGGCT 
CAACGTTTGC TCAACGAAAT GAGCGATGGT GAGCGCCAAC GGATTATGAT TGCCCGCGCC 
TTGGCCCAAG AGCCAGCCGT GATGATTCTC GATGAGCCAA CCGCTTTTCT CGATTTGCCT 
CGGCGGGTCG AAATTACCAG TTTGTTGCGC AAACTAGCCC ACGAAACTGG CTTATCCGTG 
GTTATGTCTA CTCACGATCT TGATTTGGCG ATTGGCAGCG CTGATCGGTT GTGGCTAGTT 
TTCGATGATG GCAGCATAGA ATGTGGAACC CCTGAAGATT TGATTTTAGA TGGTCGGTTG 
GCCCAAACCT TCCGCAAAAG CCAATTGCAA TTTGATCAAC AACGCGGCGG CTTTCGCGCC 
CAAACCCAGC CAATTGGCCA GGTTCGGCTG AGTGCCAACG GCTTGCATGG CCAATGGATG 
CAGCATGCCC TAGAACGAGC AGGCTATCAC GTGCTGAATG CAAAACAGGC TGATTGCCCA 
CATATTCAGC AGCTTGAAAA CGATTGCTGG CAAGTTGAAC ACCAGCCATG CGCCAACATT 
GACCAAGTGT TGGCTTATTT AGGCAACATT TAA

Protein sequence

MNQPVLATDN LSVGYHQRRG QSRSVLQNLN LSLAKGEFVC LLGANGAGKS TLIRTLTHMQ 
APISGSVTIN QQPLHHLSKA QLAKQLSVVL TDRLQVSNLT GYELVSLGRM PYTNLFGSLN 
QHDHQVVRWA LHATNSDDLA QRLLNEMSDG ERQRIMIARA LAQEPAVMIL DEPTAFLDLP 
RRVEITSLLR KLAHETGLSV VMSTHDLDLA IGSADRLWLV FDDGSIECGT PEDLILDGRL 
AQTFRKSQLQ FDQQRGGFRA QTQPIGQVRL SANGLHGQWM QHALERAGYH VLNAKQADCP 
HIQQLENDCW QVEHQPCANI DQVLAYLGNI