Gene PCC8801_0051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0051
Symbol
ID	7103716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	53891
End bp	54991
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	34%
IMG OID	643473167
Product	glycosyl transferase group 1
Protein accession	YP_002370314
Protein GI	218244943
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTT TATACGACGG TGAAATCTAC TCTAATCAAG TTGCAGGCGG AATTAATCGT 
TATTTTGCCA ATATTATTAG TCGGCTTCCC TCTGATTTTA CTCCCTCATT AATAGTAGAA 
AGCTCCCCTG AACTAAACTA TCCTGTTCAT CCTAATTTAA AAAGTTTGTG GTGGTATAAA 
AGATTTCGTC CAGAACGCCT TCGTATTTTG ACTGATAAAT TATATTCTAA TGCTATCAAT 
AAGTTTAATC ATTTTGACCT TGCTCATCCC ACTTATTATT CATTAGTGAC TCGTCAACCT 
CTAGATAATT ATAAGTGTCC TATTGTGATA ACGGTTTATG ATATGATTCA TGAACTTTTA 
CCTCAACAGG TTCCCTATAG TAGTCATGGA ATTTCAATTA AAAGTAAAGC AATTAAATCA 
GCACAAGCTA TCATTTGTAT TTCAGAAAAT ACTAAAAAAG ATTTAGTAAA TTTGTATTCC 
ATTCCAGAAC ATAAAATATC CGTAACCTAT TTAGCAGCAG AAATTGATGT TAGTCTATCT 
TATGGGTCTG AAGTGGTGCC AAAAGATCCT TATTATCTGT ATATTGGTAG TCGAGCTAAA 
TATAAGAATT TTGACCGTTT ATTACTAGCT TTTGCAAAAA CTATTTCAGC GCAATCTGAT 
CTGAAATTGT GTGTTATAGG TTCACCTTTT AATGAGAAAG AAGCAAAAAG AATTGCTGAA 
CTAAAGTTAG GTGATCATCT AGAAAATTAT GGATATGTCA GTGACTCTCA TCTTGCTAAA 
CTTTATCGTA ATAGTATGGC TCTTGTTTAT CCTTCCCTAT ACGAAGGTTT TGGTATTCCT 
CCTCTTGAAG CAATGTCCTG TCAAACGGCT GTAATTGCTG CCAACTCATC GAGTCTTCCT 
GAAGTTGTAG ATGATGCTGG TTTGCTATTT AATCCTGAGT CTACTGATGA ATTAGCAGAA 
CAATTAATCT TTTTGCTTAA TCATCCTATA GAACGGGAAA ATTTAATTAC AAAAGGTTAT 
GCAAGAAGCA AGTTATTTAC TTGGGAAAAA ACTGTAGCTG AAACCATTGA TGTTTATCGT 
TCCCTCACTG AATCAAGGTA G

Protein sequence

MKILYDGEIY SNQVAGGINR YFANIISRLP SDFTPSLIVE SSPELNYPVH PNLKSLWWYK 
RFRPERLRIL TDKLYSNAIN KFNHFDLAHP TYYSLVTRQP LDNYKCPIVI TVYDMIHELL 
PQQVPYSSHG ISIKSKAIKS AQAIICISEN TKKDLVNLYS IPEHKISVTY LAAEIDVSLS 
YGSEVVPKDP YYLYIGSRAK YKNFDRLLLA FAKTISAQSD LKLCVIGSPF NEKEAKRIAE 
LKLGDHLENY GYVSDSHLAK LYRNSMALVY PSLYEGFGIP PLEAMSCQTA VIAANSSSLP 
EVVDDAGLLF NPESTDELAE QLIFLLNHPI ERENLITKGY ARSKLFTWEK TVAETIDVYR 
SLTESR