Gene PCC8801_3028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3028
Symbol
ID	7105436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3158314
End bp	3159351
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	34%
IMG OID	643476055
Product	Taurine catabolism dioxygenase TauD/TfdA
Protein accession	YP_002373168
Protein GI	218247797
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTCCA AACCTTTAAA AACCATTAAA CGACGGGCAG TCAATATTGC TGCTTCCCAG 
TTAGTAACTG TTTCTTGTTT TGAGCAAAAA CCGATTCCAA TTATTATTCA GCCTAATCAA 
AATAATTTAG ACTTAATTGC TTGGGCAACT TATCATCAAG AAGTAATTAA TAACTATTTA 
CAGCAACAAG GTGCTATTCT ATTTCGAGGG TTTAGCATCA ATAAATTGGC ACAGTTTGAA 
GAGTTAATGA CAGCTCTTTT TGGTTCCCTT TTAGATTATT CTTATGGTTC AACCCCAAGA 
CATAAAGTTA AAGGAAGTAT TTATACTTCA ACGGAATATC CCCCTGAGCA ATTTATTCCC 
TTACATAATG AGATGTCTTA TGCTTCAAAT TGGCCAGAGA AAATTGGATT TTTCTGTTTA 
AAAGCAGCTA CACAAGGGGG AGAAACACCT ATTGCTAATA GTCGTCGCAT TTTTCAACGG 
ATTGATCCTA AAATTAGAGA AAAGTTTCAA GAAAAAGGAA TACTGTATGT GAGAAATTAC 
AGTGAACAGT TAGATTTGCC TTGGCAAAAA GTTTTTCAAA CCACTAATAA ATTACAGGTT 
GAAAACTATT GTCGTCAATC AGGAATTGAA TGGGAATGGA ATGACAATCA TTTAAAAACT 
CGTCAAATTT GTCAAGCAGT TGCTAATCAT CCCCAAACTA ATGAAATGGT ATGGTTTAAT 
CAAGCTCATT TATTCCATGT TTCTAGTTTA AATTCATCTT TTAGAGATAG TCTTCTAGAA 
GTATTAAAAG AGGAAGATTT ACCCCGTAAT GCTTATTATG GTGATGGTAC TCCTTTAGAA 
GTTTCTGTTT TGGAGGAAAT TCGCACAATT TATCAAGAAG AAATGGTGAT ATTTTCTTGG 
CAATCAGGAG ATTTATTATT ACTAGATAAT ATGTTAACGG CTCATGGACG AATGCCGTTT 
ACCGGAGAGC GACGAGTGGT TGTCGCTATG GCTCAACCCC ATGATTTGGT CGTTAAAACT 
TGGACAACCT TAATTTAG

Protein sequence

MISKPLKTIK RRAVNIAASQ LVTVSCFEQK PIPIIIQPNQ NNLDLIAWAT YHQEVINNYL 
QQQGAILFRG FSINKLAQFE ELMTALFGSL LDYSYGSTPR HKVKGSIYTS TEYPPEQFIP 
LHNEMSYASN WPEKIGFFCL KAATQGGETP IANSRRIFQR IDPKIREKFQ EKGILYVRNY 
SEQLDLPWQK VFQTTNKLQV ENYCRQSGIE WEWNDNHLKT RQICQAVANH PQTNEMVWFN 
QAHLFHVSSL NSSFRDSLLE VLKEEDLPRN AYYGDGTPLE VSVLEEIRTI YQEEMVIFSW 
QSGDLLLLDN MLTAHGRMPF TGERRVVVAM AQPHDLVVKT WTTLI