Gene Daro_1248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1248
Symbol
ID	3569355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1354594
End bp	1355640
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	59%
IMG OID	637679714
Product	N-acetylneuraminate synthase
Protein accession	YP_284473
Protein GI	71906886
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2089] Sialic acid synthase
TIGRFAM ID	[TIGR03586] pseudaminic acid synthase

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	0.862744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTTT CAATTGATGG CCGTCGCATT GGCCACGATG CTCCGCCGTT CATCATTGCC 
GAGCTGTCGG CCAACCACAA CGGCTCGCTG GAGCGTGCGC TTCAAACCAT TGATGCAGCC 
AAAGCCTGTG GGGCGGATGC AATCAAATTG CAGACCTATA CGGCCGACAC GATGACAATC 
GACTGCGATC AGCCTGAGTT CATGATCCGC GGCGGCCTGT GGGATGGATA CAAGCTGTAC 
GACCTCTATC AGTGGGCACA GACACCTTTC GACTGGCACA AGGCCATGTT CGAACATGCG 
CGAAAGATAG GCATCACGGT CTTTTCGACA CCCTTCGATG AGAGCGCTGT CGACTTGCTG 
GAAGCCCTCG ATACGCCAGC TTACAAAATC GCCTCGTTCG AACTGACAGA CCTACCCCTG 
ATCCGCTACG TGGCCGCGAC CGGCAAGCCG ATGATCATGT CGACCGGAAT GGCCAGCGAG 
GCTGAAATCG AGGAAGCAGT GAGCGCGGCC CGTGAAGCGG GTTGCACCGA CCTTGTCCTG 
CTCCATTGCA TCAGCAGCTA TCCCGCACCG ATGGATCAGG CCAAACTGCG ACAGATCGCG 
GGCCTTGAAA GCCGCTTCGG CGTCACGCCG GGCCTGTCCG ATCACACGCT TGGCACGGTA 
GCCTCGGTGG CTGGTGTAGC CCTCGGCGCT TGCGTAATCG AAAAACATTT CACCCTGAGC 
CGCGCGGACA AGGGGCCGGA CAGCGAGTTC TCCCTTGAAC CGGACGAATT GCGCCGGCTG 
TGCCAGGATG CCCGCGACGC CTGGTCGGCA CTTGGAAGCC TCGGGTTTGA ACGGCAGCAA 
GCTGAGGAGG CGAGCAAGGT CTTCCGGCGG TCGGTGTATT TCGTGCGCGA TGTGAGCGCT 
GGTACCGTGA TAGGAGCGGA ACACATCCGT CGCATACGCC CGGGGATGGG GCTTGAACCA 
AAATACTTTG ATCAGTTGAT CGGCAGGCGC GTGAATCAGG ATGTCTCGCG CGGCACGCCA 
GTGAAATGGA CGCACTTCGA TGAATAG

Protein sequence

MSFSIDGRRI GHDAPPFIIA ELSANHNGSL ERALQTIDAA KACGADAIKL QTYTADTMTI 
DCDQPEFMIR GGLWDGYKLY DLYQWAQTPF DWHKAMFEHA RKIGITVFST PFDESAVDLL 
EALDTPAYKI ASFELTDLPL IRYVAATGKP MIMSTGMASE AEIEEAVSAA REAGCTDLVL 
LHCISSYPAP MDQAKLRQIA GLESRFGVTP GLSDHTLGTV ASVAGVALGA CVIEKHFTLS 
RADKGPDSEF SLEPDELRRL CQDARDAWSA LGSLGFERQQ AEEASKVFRR SVYFVRDVSA 
GTVIGAEHIR RIRPGMGLEP KYFDQLIGRR VNQDVSRGTP VKWTHFDE