Gene Cyan8802_3442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3442
Symbol
ID	8392778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3513603
End bp	3514985
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	46%
IMG OID	644981377
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_003139103
Protein GI	257061215
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.309449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATCAC AATGGGTTGC GAAGCGTCGC GGACAGAGCA ATGTATCCCA AATGCACTAT 
GCTCGTCAAG GCATGATCAC CGAGGAAATG GATTATGTTG CCAAACGGGA AAATCTTCCC 
CCTGACTTAA TTCGTCAAGA AGTCGCACGG GGACGGATGA TTATTCCCGC CAATATTAAC 
CATCTTAACC TAGAACCGAT GGCCATTGGT ATTGCCTCAA AATGCAAGGT TAATGCCAAT 
ATTGGGGCAT CTCCTAACTC TTCTAACCTA GAGGAAGAAG TCGCTAAACT CAACCTAGCC 
GTCAAATACG GTGCAGATAC CGTGATGGAC TTGTCTACGG GGGGAGGAGA CTTAGACACC 
ATTCGGACGG CAATTATTAA CGCTTCTCCT GTCCCTATTG GAACTGTTCC CATTTATCAA 
GCCGTGGAAA GCGTCCACGG GAATATCGAA AAGCTAACCC CTGATGATTT CTTGCACATC 
ATTGAGAAAC ACGCTCAACA GGGTGTGGAC TACATGACCA TCCATGCGGG ACTGTTAATA 
GAATACCTTC CCTTGGTCAG AAGTCGTCTA ACAGGGATTG TCTCTCGCGG CGGTGGTATT 
ATTGCTAAGT GGATGCTGCA CCATCACAAG CAAAACCCGC TTTATACCCA TTTTGATGAG 
ATTATTGAGA TCTTTAAGAA ATACGACGTT TCTTTTAGTT TAGGAGATTC ATTGCGCCCT 
GGTTGTACCC ACGATGCGTC CGATGAAGCT CAACTGTCTG AGTTGAAAAC CCTTGGACAA 
TTAACCCGTC GTGCTTGGGA GCATGATGTT CAGGTGATGG TGGAAGGTCC AGGCCATGTT 
CCGATGGATC AAATTGAGTT TAATGTCAAA AAACAAATGG AAGAGTGTAG CGAAGCACCT 
TTCTATGTTT TGGGTCCATT GGTGACAGAT ATTGCTCCAG GATATGATCA TATTACCTCA 
GCGATCGGGG CAGCGATGGC CGGTTGGTAT GGAACGGCAA TGTTATGCTA TGTTACTCCG 
AAAGAGCATT TAGGGTTGCC TGATGCGGAG GACGTGCGTA ATGGGTTAAT TGCCTATAAA 
ATTGCGGCTC ATGCTGCCGA TATTGCTCGT CAACGTCCAG GAGCACGCGA TCGGGATGAT 
GAACTGTCGA AAGCCCGTTA TAATTTTGAC TGGAACCGTC AGTTTGAACT ATCGTTAGAT 
CCCGATCGCG CCAGGGAATA TCACGATGAA ACTTTGCCCG CAGATATCTA TAAAACGGCG 
GAGTTTTGTT CAATGTGTGG ACCGAAGTTC TGTCCCATGC AAACGAAAGT AGATGCGGAT 
GCGTTGACGG AATTGGAGAA ATTCCTAGCC GAACAAAAGA ACAAAGAAGC GATTGCTCAT 
TAA

Protein sequence

MRSQWVAKRR GQSNVSQMHY ARQGMITEEM DYVAKRENLP PDLIRQEVAR GRMIIPANIN 
HLNLEPMAIG IASKCKVNAN IGASPNSSNL EEEVAKLNLA VKYGADTVMD LSTGGGDLDT 
IRTAIINASP VPIGTVPIYQ AVESVHGNIE KLTPDDFLHI IEKHAQQGVD YMTIHAGLLI 
EYLPLVRSRL TGIVSRGGGI IAKWMLHHHK QNPLYTHFDE IIEIFKKYDV SFSLGDSLRP 
GCTHDASDEA QLSELKTLGQ LTRRAWEHDV QVMVEGPGHV PMDQIEFNVK KQMEECSEAP 
FYVLGPLVTD IAPGYDHITS AIGAAMAGWY GTAMLCYVTP KEHLGLPDAE DVRNGLIAYK 
IAAHAADIAR QRPGARDRDD ELSKARYNFD WNRQFELSLD PDRAREYHDE TLPADIYKTA 
EFCSMCGPKF CPMQTKVDAD ALTELEKFLA EQKNKEAIAH