Gene PCC8801_4242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4242
Symbol
ID	7103795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4451796
End bp	4452989
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	35%
IMG OID	643477223
Product	hopene-associated glycosyltransferase HpnB
Protein accession	YP_002374322
Protein GI	218248951
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03469] hopene-associated glycosyltransferase HpnB

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACA TACTATTATT AACGACAATT TTATCATTAA TCATTTGGGT TTATTTATTA 
CTCTTCAGAG GAGGTTTTTG GCTATCAAAT CAAAAGATCA AACCCCAAGC ACTAGGAATA 
ACTGATTATC CTTCTGTTTA TGCTGTTATC CCTGCACGCA ATGAAGCTGA TGTTTTACCT 
ATTAGTTTAA AATCCCTATT AAACCAAGAT TATTTAGGTC AATTTACTAT TATTTTAATC 
GATGATCAAA GTAGTGATGG AACAGGAGAA GTTGCTCAAG AAATTGCTAA AAACTGTCAT 
CAATCTAACC GTTTAATTGT TATTTCAGGA CAGACATTAC CCACTGGATG GTCAGGAAAA 
TTATGGGCAA TGGAGCAGGG ACTTAAATAC ATAAAAAAGC ATAATTGTCA ACCAAAATAT 
ATACTTTTTA CCGATGCTGA TATTGAACAT CATCCAACTA ATTTACAGGA ATTAGTAACA 
AAATCTCAGC AAGAAAATTT AGCCTTAACT TCCTTGATGG TGTGGTTAAG ATGTCAAAGT 
ATTTGGGAAC AATTTTTAAT TCCTGCGTTT GTCTTTTTCT TTGAGAAACT CTATCCTTTT 
GCTTGGGTTA ACAACGCTAA AAATAAAATG GCTGCTGCTG CGGGAGGATG TATCCTCATT 
CGTCGGGATA TCCTCGAAGA AATTGGAGGA TTAGAGATAG TCCGTCAAGC ATTAATTGAT 
GATTGTTCCT TAGCTGCTGC GGTGAAATCT AAATTACAAC AGAACCCAAA CAATACCCAA 
GGAATTTGGT TAGGATTAAG TGAAAAAACC CGTAGTTTAC GGCCTTATGA TTCCTTAGAA 
ACGATTTGGA ATATGGTAGC CAGAACTGCC TATACGCAAC TCAATTATTC CCCTTTATTA 
CTAAGTGGAA CAGTTTTAGG ATTAACCCTA GTTTATCTAA TTCCTATCTT GAGTTTAGCG 
TTAGGATTAC TCCTAGGAAA TAGCTTAATT GCTCTTTTTG GGGGGATAAC TTGGATACTA 
ATGGCTATTG CCTATTTACC TACTTTAATC CTTTATAAAG CCTCACCCTT ATGGTCGTTA 
ACCTTACCAA TTATTGCCTT TTTATACTTA TTAATGACTA TAGATTCTGC GCTGCGTCAT 
TGGCAAGGAA AAGGAGGTGC TTGGAAGGGA AGAGTTTATG CCAATAATGA ATAA

Protein sequence

MENILLLTTI LSLIIWVYLL LFRGGFWLSN QKIKPQALGI TDYPSVYAVI PARNEADVLP 
ISLKSLLNQD YLGQFTIILI DDQSSDGTGE VAQEIAKNCH QSNRLIVISG QTLPTGWSGK 
LWAMEQGLKY IKKHNCQPKY ILFTDADIEH HPTNLQELVT KSQQENLALT SLMVWLRCQS 
IWEQFLIPAF VFFFEKLYPF AWVNNAKNKM AAAAGGCILI RRDILEEIGG LEIVRQALID 
DCSLAAAVKS KLQQNPNNTQ GIWLGLSEKT RSLRPYDSLE TIWNMVARTA YTQLNYSPLL 
LSGTVLGLTL VYLIPILSLA LGLLLGNSLI ALFGGITWIL MAIAYLPTLI LYKASPLWSL 
TLPIIAFLYL LMTIDSALRH WQGKGGAWKG RVYANNE