Gene Saro_2339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2339
Symbol
ID	3915684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2487195
End bp	2488199
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	67%
IMG OID	640445095
Product	hypothetical protein
Protein accession	YP_497610
Protein GI	87200353
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACGTCT ATCACGCCAG TCTCGAGGAA GCGCAAGCCG ACCCGCGCCT GAAGGGGTTG 
CAAGGCGCCT CGCCGTTCGA GCGGCTGGAC TGGCTGGCGC TGCTGGCGAA CGAATGCCTC 
GACCCGGCGC GGGCGCGCCT GAGCGTGGTC ACCAGCGGCG AGTGCATGGC CGCGCTCCCC 
TGGATCGAGC GCGAGGGACG GATCGACGCG CTGGCCAACT GGTACAGCTT TTTTGTTTCT 
CCTCTTGGCG ATAGCGCTCT TCTTTCACGG ATAGTCGAGG CGCTTCCGCA CGGGCGCGCC 
GCGTTCGCGC CACTGCCCGA GGAAGATGCG CGCCTGCTTG CCCGCGCCTT TCGGAACGCG 
GGGTGGTGTA CGCTCGCGGC GCCTTGCGAC GTCAACCATG TGCTTCCGGT CGAGGGGCGG 
TCCTTCGCCC AATACTGGGC CGAGCGTCCG GGCGCGCTGC GCGAGACGGT GCGTCGCAAG 
AGCCGCAAGG GCGAAGTATC CTTGCGCATC TTGACCGAAT TTTCTCCCGA AGATTGGGAG 
GCTTACGAGA CGATCTACAG GCTGAGCTGG AAGCCGGGCG AAGGCAGCCC GGCATTCCTG 
CGCAAATGGG CCGAAGCCGA TGGCGAGGCG GGGCGGCTGC GGCTCGGCAT TGCCGAAATC 
GACGGAGCGG CAGTGGCCGC GCAGTTCTGG ACCGTCGAGG GTGGCACGGC CTACATCCAC 
AAGCTCGCCC ACGACGAACG CTTCCGAAAA TCCTCGCCCG GGACGCTCCT GACGGCCGCG 
ATGTTCGAAC ACGTGATCGA CCGCGACCGC GTGGACCTGA TCGATTTCGG GACAGGAGAC 
GATCCCTACA AGCGCGACTG GATGGACGAC GTGCGCTCGC GCTGGAGCGT GCAGGCCTGG 
CGTCCGGGCG CAGTGCGGCA CTGGCCCTCG CTGGCCCTGG CGCTGGCCCG GACACTGGCC 
GGGCAGATCA TGCGGCCTCT TGTGTCGCGA AATGGCGATG GTTAA

Protein sequence

MNVYHASLEE AQADPRLKGL QGASPFERLD WLALLANECL DPARARLSVV TSGECMAALP 
WIEREGRIDA LANWYSFFVS PLGDSALLSR IVEALPHGRA AFAPLPEEDA RLLARAFRNA 
GWCTLAAPCD VNHVLPVEGR SFAQYWAERP GALRETVRRK SRKGEVSLRI LTEFSPEDWE 
AYETIYRLSW KPGEGSPAFL RKWAEADGEA GRLRLGIAEI DGAAVAAQFW TVEGGTAYIH 
KLAHDERFRK SSPGTLLTAA MFEHVIDRDR VDLIDFGTGD DPYKRDWMDD VRSRWSVQAW 
RPGAVRHWPS LALALARTLA GQIMRPLVSR NGDG