Gene PCC8801_2662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2662
Symbol
ID	7102061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2746505
End bp	2747887
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	47%
IMG OID	643475701
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_002372820
Protein GI	218247449
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATCAC AATGGGTTGC GAAGCGTCGC GGACAGAGCA ATGTATCCCA AATGCACTAT 
GCTCGTCAAG GCATGATCAC CGAGGAAATG GATTATGTTG CCAAACGGGA AAATCTTCCC 
CCTGACTTAA TTCGTCAAGA AGTCGCACGG GGACGGATGA TTATTCCCGC CAATATTAAC 
CATCTTAACC TAGAACCGAT GGCCATTGGT ATTGCCTCAA AATGCAAGGT TAATGCCAAT 
ATTGGGGCAT CTCCTAACTC TTCTAACCTA GAGGAAGAAG TCGCTAAACT CAACCTAGCC 
GTCAAATACG GTGCTGATAC CGTGATGGAC TTGTCCACAG GGGGAGGAGA CTTAGACACC 
ATTCGCACCG CCATTATTAA CGCTTCTCCC GTTCCTATTG GAACCGTTCC CATTTATCAA 
GCCGTGGAAA GCGTCCACGG GAATATCGAA AAGCTGACCC CTGATGATTT CTTGCACATC 
ATTGAGAAAC ACGCTCAACA GGGTGTGGAC TACATGACCA TCCATGCGGG ACTGTTAATA 
GAATACCTTC CCTTGGTCAG AAGTCGTCTA ACAGGGATTG TCTCTCGCGG CGGTGGTATT 
ATTGCTAAGT GGATGCTGCA CCATCACAAG CAAAACCCGC TTTATACCCA TTTTGATGAG 
ATTATTGAGA TCTTTAAGAA ATACGACGTT TCTTTTAGTT TAGGAGATTC ATTGCGCCCT 
GGTTGTACCC ACGATGCGTC CGATGAAGCT CAACTGTCTG AGTTGAAAAC CCTTGGACAA 
TTAACCCGTC GTGCTTGGGA GCATGATGTT CAGGTGATGG TGGAAGGTCC AGGCCATGTT 
CCGATGGATC AAATTGAGTT TAATGTCAAA AAACAAATGG AAGAGTGTAG CGAAGCACCT 
TTCTATGTTT TGGGTCCATT GGTGACAGAT ATTGCTCCAG GATATGATCA TATTACCTCA 
GCGATCGGGG CAGCGATGGC CGGTTGGTAT GGAACGGCAA TGTTATGCTA TGTTACTCCG 
AAAGAGCATT TAGGGTTGCC TGATGCGGAG GACGTGCGTA ATGGGTTAAT TGCCTATAAA 
ATTGCGGCTC ATGCTGCCGA TATTGCTCGT CAACGTCCAG GGGCACGAGA CCGGGATGAT 
GAACTGTCGA AAGCCCGTTA TAATTTTGAC TGGAACCGTC AGTTTGAACT ATCGTTAGAT 
CCCGATCGCG CCAGGGAATA TCACGATGAA ACTTTGCCCG CAGATATCTA TAAAACGGCG 
GAGTTTTGTT CAATGTGTGG ACCGAAGTTC TGTCCCATGC AAACGAAAGT AGATGCGGAT 
GCGTTGACGG AATTGGAGAA ATTCCTAGCC GAACAAAAGA ACAAAGAAGC GATTGCTCAT 
TAA

Protein sequence

MRSQWVAKRR GQSNVSQMHY ARQGMITEEM DYVAKRENLP PDLIRQEVAR GRMIIPANIN 
HLNLEPMAIG IASKCKVNAN IGASPNSSNL EEEVAKLNLA VKYGADTVMD LSTGGGDLDT 
IRTAIINASP VPIGTVPIYQ AVESVHGNIE KLTPDDFLHI IEKHAQQGVD YMTIHAGLLI 
EYLPLVRSRL TGIVSRGGGI IAKWMLHHHK QNPLYTHFDE IIEIFKKYDV SFSLGDSLRP 
GCTHDASDEA QLSELKTLGQ LTRRAWEHDV QVMVEGPGHV PMDQIEFNVK KQMEECSEAP 
FYVLGPLVTD IAPGYDHITS AIGAAMAGWY GTAMLCYVTP KEHLGLPDAE DVRNGLIAYK 
IAAHAADIAR QRPGARDRDD ELSKARYNFD WNRQFELSLD PDRAREYHDE TLPADIYKTA 
EFCSMCGPKF CPMQTKVDAD ALTELEKFLA EQKNKEAIAH