Gene Saro_1879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1879
Symbol
ID	3917100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1981934
End bp	1983067
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	66%
IMG OID	640444623
Product	levansucrase
Protein accession	YP_497153
Protein GI	87199896
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGTGG TCAATCCATC AGAACAATCG ATTGCCTCGT TTGGCGCGAC GCCGTGGCGT 
CCCGCAGGCT ACGGCCAGAG CGCCCGGATT CCGCTCATCG AAGCCGCCGA TGTCGTGCGC 
CTCTTCGACG ACCTGGACCT GTGGGACTGC TGGCCCCTCG CGCACGAGGA CGGGCGTACG 
GTTGAGCATC TGGGACGCAA CTGGTGGTTC TTTCTTTCGG CGCCGGTCTT CCCCGATCCG 
GTCGAACGGC ATGGCCATGC CCGCATCCGC CTCGTCTCGC TGGGGGAGGA TGGATGGAAG 
GATCACGGCA ACGCCTTTCC CGATGGTCTC ACGCCCGGCA GCCGCGAATG GGCGGGTTCG 
GCCGTGCTGA TGGACGACGG GCGCACCGTG CAGCATTTCT TCACCGCCGC AGGACGGCGC 
GGCGAGGCTG CACCGACCTT CGAGCAACGC ATATTCGTCA GCGAAGGCAC CCTGACCGAG 
GCCGGCCCTG GCGGATGGCA AGCCCCGCGC GAGATATTCG AGGCCGATGG CCTACGCTAC 
GTGCTCGACC GGCAGGACAG TGGGGCGCCG GGCCAGATCA AGGGTTTTCG CGATCCCGCG 
TGGCTTCGAG ATCCGGCCAC CGGCAGGGCG CACATCCTGT TCACCGGCAG CGCCGCATGG 
TCGGATCATC CTTTCAACGG CAATGTGGGG ATCGCCACGC TCGAGGGTGA CACCTGGGTT 
CTCGGCAATC CACTGGTCGA GGCGATCGAC GTGAACAACG AGCTTGAACG GCCGCACATC 
CTGGTGCGCG ACGGGCTGTA CTATCTCTTC TGGTCGACCC AGACCCACAC TTTCGCGCCC 
GCTGCGGTGG CAGGGCCCAA CGGCCTCTAC GGCATGGTGG CTGAAAGCCT TGCGGGCCCC 
TGGCGCATGC TCAACGAAGG CGGGCTGGTC GCGGCGAACC CGGATGCGGA AGCAAAGCAG 
TCCTACAGTT GGTGGGTCAC CGGCGAGGGC GAAGTGTGGA GCTTCGTCGA CTACTGGGGC 
ATGGCAGGGC GCACCGTCGA GGAGCAACCC GAATTGCTGC GCAGCAATTT CGGGGGAACC 
CCCGCACCTC GGTTCATGCT TAACTTCGAT GGCGAGCGGG TCACCATCGC CTGA

Protein sequence

MSVVNPSEQS IASFGATPWR PAGYGQSARI PLIEAADVVR LFDDLDLWDC WPLAHEDGRT 
VEHLGRNWWF FLSAPVFPDP VERHGHARIR LVSLGEDGWK DHGNAFPDGL TPGSREWAGS 
AVLMDDGRTV QHFFTAAGRR GEAAPTFEQR IFVSEGTLTE AGPGGWQAPR EIFEADGLRY 
VLDRQDSGAP GQIKGFRDPA WLRDPATGRA HILFTGSAAW SDHPFNGNVG IATLEGDTWV 
LGNPLVEAID VNNELERPHI LVRDGLYYLF WSTQTHTFAP AAVAGPNGLY GMVAESLAGP 
WRMLNEGGLV AANPDAEAKQ SYSWWVTGEG EVWSFVDYWG MAGRTVEEQP ELLRSNFGGT 
PAPRFMLNFD GERVTIA