Gene PCC8801_3387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3387
Symbol
ID	7103091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3533702
End bp	3534976
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	37%
IMG OID	643476402
Product	glycosyl transferase group 1
Protein accession	YP_002373511
Protein GI	218248140
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAATCC TAATTTATTC TTACAACTAT CATCCTGAAC CCATCGGTAT TGCTCCTCTG 
ATGACAGAAT TAGCAGAGGG ATTAGTCAAA CGCGGACATC AAGTGCGGGT AGTAACGGCA 
ATGCCTTGGT ATCCTTCAAG TGAAATTTCT GCTGAGTATC GCGGAAAATT GTATCTAACA 
GAAGACCGTA ACGGGGTTAA AATTCAACGA TGCTATGTTT GGATTCGACG CAAACGCAAT 
TTTAAAAATC GTGTTTTATT TGAATTAAGC TTTGTTTTTC TGAGTTTTCT ACAAGCGTTA 
CAAGGATGGC GACCGGATGT TATTTTTTTG ACAATTCCTG GTTTACCCGT TTGTGTTCCA 
GCAGCTATTT TAGCTCGGTT ATATCGTATT CCTATTCTTT TAAATCTTCA AGATATTCTG 
CCTGATGCTG CTATCCATGT GGGTTTAATC ACTAATCAAA AAATGATTAA AGTGTTTCAA 
TGGTTAGAAG CATTTGCTTA TAAAACGGCA ACTAAAATTA GTGTTATTGC TGATGGATTT 
ACCAAAAACT TAATCAGTAA AGGAGTTCCA TCGGATAAAA TTGTTGAGGT TCCTAACTGG 
GTTGATGTCA ACTTTATTAA ACCTTTACCT CAAGAGAATA ATTACTTTCG CCAAGAGAAT 
AATTTGGCAA ATAAATTCGT TATTCTATAC TCTGGTAATA TTGCCTTAAC TCAACCGTTA 
GAAACCTTAA TTGATGCAGC AGCATTAGTC GGATATATTC CAGAAATTGC TATCGTGATT 
GTAGGGAAAA AAGAGGCTCT AGAAAGGCTA GAAATATATC GGCAAAGAAA ACAAGCCAAT 
AATGTCATTT TAAGACCTTT TCAGCCGAGA GAAAAATTAC CCGAAATGTT AGCAGCGGCC 
GATGTGGGAA TGGTGATGCA AAAAGGTAAT GTAATTGCCT TTAATATGCC CTCAAAAATT 
CAAGTTTTGT TAGCCAGTGG TCGAGCGATT ATTGCTTCTG TCCCAGCCGC AGGAACAGCA 
GCTAGAGCCA TTAAAAAAAG TGGGGGAGGA ATTGTGGTTC CTCCCGAAGA TCCTCAAGCC 
ATTGCTAAGG CTATTGTAGA CTTTTATTCT AATCCAGATT TAGTGGCTCG TTTAGGGCAA 
CAAGGAAGAG AATATGCTAT CCAAAATTAT GCTTTTGATT CAACGTTAGA TCAATATGAA 
AACTTATTAC AGTCAGTGGT TAAACCCCTT AAAAGTAAGG AGGAATTGCA TAAAATAATC 
AACAATAAGG AATAG

Protein sequence

MRILIYSYNY HPEPIGIAPL MTELAEGLVK RGHQVRVVTA MPWYPSSEIS AEYRGKLYLT 
EDRNGVKIQR CYVWIRRKRN FKNRVLFELS FVFLSFLQAL QGWRPDVIFL TIPGLPVCVP 
AAILARLYRI PILLNLQDIL PDAAIHVGLI TNQKMIKVFQ WLEAFAYKTA TKISVIADGF 
TKNLISKGVP SDKIVEVPNW VDVNFIKPLP QENNYFRQEN NLANKFVILY SGNIALTQPL 
ETLIDAAALV GYIPEIAIVI VGKKEALERL EIYRQRKQAN NVILRPFQPR EKLPEMLAAA 
DVGMVMQKGN VIAFNMPSKI QVLLASGRAI IASVPAAGTA ARAIKKSGGG IVVPPEDPQA 
IAKAIVDFYS NPDLVARLGQ QGREYAIQNY AFDSTLDQYE NLLQSVVKPL KSKEELHKII 
NNKE