Gene Haur_2105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2105
Symbol
ID	5733993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2632404
End bp	2633462
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	53%
IMG OID	641279246
Product	taurine catabolism dioxygenase TauD/TfdA
Protein accession	YP_001544873
Protein GI	159898626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAGCAA AATCTGGTTT GAAAAAACAA CTTGGCAGCA TTAAACGCCA AGCCTTAGCG 
ACCGATCAAC AAGCGTTGGT GACGACGAGC TTTTTAAGTG AGGGCCAAAA CTTGCCTTTG 
GTGGTGCGGC CAAGCGTTGC CGGGGTTGAT TTAGCGCAAT GGGCAACCAA TAACTTAGCG 
TGGCTGACGA CGCAATTGCA TCATTACGGC GGGGTTTTAT TCCGTGGTTT TGGCGTAGAT 
ACCGCCCAAG CTTTCGAGAC GGTGATAAGC GCTGCCTCAG GTGAGTTGCT GGAATATCGT 
GAGCGCTCGT CGCCGCGCAG CCAAGTGCAA GGCAATATCT ACACTTCGAC CGAGCATCCG 
GCTGATCAAA CGATTTTTCT GCATAACGAA AATTCGTATC AACAAGCCTG GCCGCGCCAA 
ATTTTCTTCT GCTGTACGAT CGAGCCGGCC ACGGGCGGCG AAACCCCGAT TGCTGATGTG 
CGCAAGGTTT ATCAACGGCT TGACCCAGCC TTGCGCCAAC GTTTTATTGA TCGCGGCATT 
TTGTATGTGC GCAACTTTGG CGGCGGCGTT GGTCTTGATT GGCGCAATGT CTTTCAAACT 
GCCGATCGGG CTGAGGTCGA TGCCTATTGC GAGCGAGTTG GGATGCAGGC AATCTGGGGC 
GAAAACGACC ATTTGCAAAC CCGCCGCATG GGTCGAGCTG TGGCAACCCA TCCCATTACT 
GGCGATCTCG TTTGGTTTAA TCATGCAACT TTTTTCCATG TGAGTACACT TGAAGCACCG 
ATTCGCGATG GCTTATTGGC CCAATTTAAG CCCGAACAAT TGCCAAACAA CAGCTATTAC 
GGCGATGGCA GCCCAATTGA GCCAGAGGTA ATGGAAACGC TGCGGGCAGC CTACCACGCC 
GAAACGATTA TGTTTCCGTG GGAGCGTGGC GATGTGCTGA TGCTCGACAA TATGTTGGTG 
GCTCATGCGC GTTCACCATT TACGGGCAGC CGTCAGGTGC TGGTGGGTAT GGCTCATCCA 
ACCACCCATG GCGATGTTGC TAATGCAATC AATGGTTAA

Protein sequence

MEAKSGLKKQ LGSIKRQALA TDQQALVTTS FLSEGQNLPL VVRPSVAGVD LAQWATNNLA 
WLTTQLHHYG GVLFRGFGVD TAQAFETVIS AASGELLEYR ERSSPRSQVQ GNIYTSTEHP 
ADQTIFLHNE NSYQQAWPRQ IFFCCTIEPA TGGETPIADV RKVYQRLDPA LRQRFIDRGI 
LYVRNFGGGV GLDWRNVFQT ADRAEVDAYC ERVGMQAIWG ENDHLQTRRM GRAVATHPIT 
GDLVWFNHAT FFHVSTLEAP IRDGLLAQFK PEQLPNNSYY GDGSPIEPEV METLRAAYHA 
ETIMFPWERG DVLMLDNMLV AHARSPFTGS RQVLVGMAHP TTHGDVANAI NG