Gene Syncc9902_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_0101
Symbol
ID	3744054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	-
Start bp	101031
End bp	102050
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	36%
IMG OID	637770267
Product	capsular polysaccharide biosynthesis protein
Protein accession	YP_376119
Protein GI	78183685
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID	[TIGR03589] UDP-N-acetylglucosamine 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0202415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATAG GTATGAAAAA AATCCTTTTA ACTGGCGGAA CCGGAAGTTT TGGGAAAGCT 
TTTATTAAAG AAACAATAAC AAAATATCAA GATGTAGAAA GATTAGTCAT TTATAGTAGA 
GATGAACTGA AACAATGGGA ACTACAGCAA ATCTATCCAG AGAAACAATA TCCACAAATT 
AGATTTTTTT TGGGAGATGT CAGAGACGAA AACAGATTAC GAAGAGCACT AGAAGGGATA 
GATACTGTAG TTCATGCAGC AGCATTAAAG CAAGTGCCAG CAGCAGAATA TAATCCTTTC 
GAATTTGTGA AAACTAACAT AATTGGTGCA AACAACTTAA TTCAAGCATG TCTAGATACT 
GAAGTATCAA ACATTGTAGC CCTAAGCACT GACAAGGCTG CTGCACCAAT TAACTTATAT 
GGAGCCACAA AACTGTGCTC AGACAAGTTA TTCATCGCAG CAAACAATGT CAGAGGCGGA 
AAAAATACAA AATTCTCAGT AGTAAGATAT GGGAACGTAA TGGGGTCAAG AGGTTCGGTG 
ATACCATATT TTTTAAAAGA AGCCAAAAAT TCAGGAAAAC TAAACATAAC TGACACCAGG 
ATGACCAGGT TCAACATAGT GCTAAAGGAA GGCGTAGAGA TGGTACATTG GGCAATAAAG 
CAAAGCATGG GTGGGGAAAT ATTTGTGCCT AAGATACCAA GTTATCGTAT TGTTGATGTT 
GCTGAAGCTA TTGCACCTTC GTTGAACCAC GAAGTAATAG GAATACGTCC AGGAGAGAAA 
ATTCACGAAG AAATGATAAC AACATCAGAC AGCACAACGA CACTTGACTT AGGTAAATAT 
TATGCAATTA CGCCTGCTGG AGGTGGAGTA ATTGAAAAAT ATAAAAAAGA AGATAGGCCT 
TATGAAAGAG TAAAAGAAGG ATTTACATAC AATTCATTAG ATAATAAACA ATATCTCAAT 
ATAAGTGAAA TAAGAGCCCT AATCAGAAGT AATATTGATC ATGATTTCAC ACCAATATAA

Protein sequence

MNIGMKKILL TGGTGSFGKA FIKETITKYQ DVERLVIYSR DELKQWELQQ IYPEKQYPQI 
RFFLGDVRDE NRLRRALEGI DTVVHAAALK QVPAAEYNPF EFVKTNIIGA NNLIQACLDT 
EVSNIVALST DKAAAPINLY GATKLCSDKL FIAANNVRGG KNTKFSVVRY GNVMGSRGSV 
IPYFLKEAKN SGKLNITDTR MTRFNIVLKE GVEMVHWAIK QSMGGEIFVP KIPSYRIVDV 
AEAIAPSLNH EVIGIRPGEK IHEEMITTSD STTTLDLGKY YAITPAGGGV IEKYKKEDRP 
YERVKEGFTY NSLDNKQYLN ISEIRALIRS NIDHDFTPI