Gene Saro_0731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0731
Symbol
ID	3918555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	773446
End bp	774426
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	67%
IMG OID	640443463
Product	capsule polysaccharide biosynthesis
Protein accession	YP_496012
Protein GI	87198755
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3563] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACGA TCATGAGCCG GCCCATCCGG CACATAAGAC ACATCCACGC CTTTCTGCGC 
GGCCAGGGGC GGGGCTTTGC CGGTTGGGGG CGCAAGGCCT CGGGCCGCAG GGCAAGCCTG 
CTCGGACGCC TTCTCGGCAG GCCCTGCGTC CTCATCGAGG ACGGCTTCCT GCGTTCGGCC 
GGACGGCACG CCCCGCCGAT CTCGCTGATC GTCGACGATA CCGGTGTGTA TTACGATGCC 
TCGGTGCCTT CGCTCGTAGA GCACCACATC AGCCGACCGA TTTCCTCGCG CCAGGCAGAA 
CGCGCCCGTC GCATCATCGC CGCCTGGCAG GCCGGCGGAC TTTCGAAGTA CAACGACCGG 
ACAAACCTGC AGCGTCCGTT GCCGGACCAT TTCATTCTGG TGGCCGACCA GACCGCAGGC 
GATCTCTCCA TTCGCCACGG CGGGGCCGGG GAAGCAGAGT TCGGGGCGAT GCTACGCGCT 
GCCCTGCGCG AAAATCCCGG ACGCCCCGTC ATCGTGAAGA CTCATCCGGA CGTATCGCAG 
GCAGGGCGCA GCGGCCATTT TGGCCCCGGC AGCCAGTACG CCGAACTAAT GGAGAACCCG 
CAAGTCATTG CGGTAACCGA AGCCTGTGAT CCTGTTCCGC TGCTCCAGCG TTCGGTCGCG 
GTCTATGCCG TCACCTCGCA GCTTGGCTTT GAAGCGCTGC TATGGGGCAA GCCGGTGCGG 
TGCTTCGGCA TGCCCTTCTA TGCTGGATGG GGCCTGACCC ACGACGAACT TCCCCCGCCC 
CGGCGCCGCC GGCCGGTCTC GCTCGAGCAA CTCGTTTACG GAGCGCTGGT CGGGGCGCCG 
CGATACGTCG ATCCCTCCAC GGGGGACAAG TGGGAGATCG AGGACGCCAT GACGCATCTC 
GCGAACTGGA GCGCCTCCCA CAACGACACC GCCGCCGCGA TTCCCGCTCC GGTCGGTGCC 
CGCCACGCTC TGACGGGCTA G

Protein sequence

MATIMSRPIR HIRHIHAFLR GQGRGFAGWG RKASGRRASL LGRLLGRPCV LIEDGFLRSA 
GRHAPPISLI VDDTGVYYDA SVPSLVEHHI SRPISSRQAE RARRIIAAWQ AGGLSKYNDR 
TNLQRPLPDH FILVADQTAG DLSIRHGGAG EAEFGAMLRA ALRENPGRPV IVKTHPDVSQ 
AGRSGHFGPG SQYAELMENP QVIAVTEACD PVPLLQRSVA VYAVTSQLGF EALLWGKPVR 
CFGMPFYAGW GLTHDELPPP RRRRPVSLEQ LVYGALVGAP RYVDPSTGDK WEIEDAMTHL 
ANWSASHNDT AAAIPAPVGA RHALTG