Gene Syncc9902_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_2104
Symbol
ID	3742106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	2007592
End bp	2008767
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	63%
IMG OID	637772301
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_378105
Protein GI	78185671
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACGGA TCACCAATGT GCGCCTGCCC GCACCCTTGG GCGGTGCAAC CAAACAACGC 
CATTGGCTGA GCCTCAGCGT TGATGACACG ATCACTGGAA TCGGCCGGAT GGGACCGAAC 
GACAGCCCAA GCGACAAGGC ACGTCCTGAC ACGGACGCCG AAAACTGGAA CGGCGACTGG 
ATTAGCCCTC GCGCAATCGA TCTGCAAATC AATGGCGGCT TGGGCTTGGC CTTCCCCGAA 
CTGACACCCA GCGACCTACC GCGACTCGTG GAACTGCTGG ATTTGCTATG GAGCGATGGC 
GTCGAAGCGA TTGCGCCAAC GTTGGTGACG TGCGGAATTG AGCCCCTTCG TAATGCCCTG 
GCCGTTTTAC GAGAGGCCAG GACGCAGCAT TGCGCTGGCC GCTGTCAGCT TTTGGGGGCC 
CACCTTGAAG GTCCATTTCT GGCGGAATCA CGCCGGGGCG CCCATCCCCG GGAGCACCTG 
GCCAGCCCAA CCCTGACGGC CCTGGAGGCA CGCATCAACG GCTTCGAATC CGAGATTGCC 
CTGATGACCC TGGCCCCAGA ACTGGTGGGG GCCGATGCAG TGATTCAGCG GCTGAAGGAT 
TTGGGAATCA TGGTGGCCCT CGGGCACAGC GCCGCCAACG CCAACACCGC TGGCCAAGCG 
TTCGAGAGAG GGGTGGGCAT GCTGACCCAC GCCTTCAATG CCATGCCAGG ACTCCATCAC 
CGCGCGCCAG GACCGATCGG CGAAGCCTGT CGAAACGGCC ACATCGCCCT AGGACTGATT 
GCTGATGGCG TGCATGTCGA CCCCACCATG GCGGTGTTGC TTCAACGGCT GGCCCCAAGC 
CAAATCGTGT TGGTGAGCGA TGCCCTAGCG CCCTACGGGC TCGCCGATGG CACACACCGC 
TGGGATGAAC GAACCCTGCT GGTGAAGAAC GGCACCTGCC GCCTCGAGGA CGGAACCCTG 
GCGGGGGTGA CCTTGCCACA ACTCGAGGGA GTGAAGCGCC TTGCCCGCTG GAGCAAGGAC 
GGATCAGCCG CCATCTGGAG TGCCACGGTG GCCCCCCGCG GCCTCATCAA CGGCCCTAAC 
GGGGTCGTCG ACGCTTTGAT CGGGAAACCC CTTTCAGCAC TTCTGCGCTG GCATCAACCC 
GAGCAAGGAG ACCTTGACTG GACCTGCGCT GCTTAG

Protein sequence

MRRITNVRLP APLGGATKQR HWLSLSVDDT ITGIGRMGPN DSPSDKARPD TDAENWNGDW 
ISPRAIDLQI NGGLGLAFPE LTPSDLPRLV ELLDLLWSDG VEAIAPTLVT CGIEPLRNAL 
AVLREARTQH CAGRCQLLGA HLEGPFLAES RRGAHPREHL ASPTLTALEA RINGFESEIA 
LMTLAPELVG ADAVIQRLKD LGIMVALGHS AANANTAGQA FERGVGMLTH AFNAMPGLHH 
RAPGPIGEAC RNGHIALGLI ADGVHVDPTM AVLLQRLAPS QIVLVSDALA PYGLADGTHR 
WDERTLLVKN GTCRLEDGTL AGVTLPQLEG VKRLARWSKD GSAAIWSATV APRGLINGPN 
GVVDALIGKP LSALLRWHQP EQGDLDWTCA A