Gene Saro_1892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1892
Symbol
ID	3917113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2002968
End bp	2005016
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	64%
IMG OID	640444636
Product	alpha-glucosidase
Protein accession	YP_497166
Protein GI	87199909
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAACC TTCTGAACGT TGCAGCGCCG CTGGCGCTGA CCCTTTCGTG CGCCCTGGCG 
ACGCCTGCCA CGGCGGAGAC GGTGACGGCA ACATCGCCGG ACGGCAGCCT GGTGCTGTCG 
GTGACCACCG ACAACGACGG CCACCCGCTC TACAGCCTGA CCCGCAAGGG CAAGCTCCTG 
CTAGGATCGT CGATGCTGGG TTTCATCACC AGCGATGGCC CAACTATGCA ACGCGGGCAG 
ACCATCATCG GCAGCGAGAA GGGATCGGGC AAGGAGACCT GGGAACAGCC CTGGGGTGAG 
CGGCGCTATG TCACCGACAA TCATAACGAG CTTCTGGTGA AGTTCGAACA GGTGCCGGAC 
TGGGGCGGGC GCCGCATGAA CGTGCGCTTC CGCCTGTTCG ACGATGGCTT CGGTTTCCGC 
TACGAGATCC CCGAACAGCC CGCGATGAAG GTGATGAAGA TCGCGGACGA GCTTACCGAG 
TTCAACGTGG CGCAGAACGG CACGGCTTGG TGGATTCCGG GCGGTGAATG GAACCGCTAT 
GAGCAGGTCT ACCAGAAGAC GGCGATCGAC GGCGTCTCGA CCGCGCACAC TCCGATCACG 
ATGAAGCTGG CGGACGGGAC GCACCTGTCG TTCCACGAGG CGGCGCTGGT GGACTATTCG 
GCGATGTGGC TGAAGCGGCA GACGGGCACC TCGTTCCGCG CCACGCTTTC ACCTTCGCCG 
AACGGGCCCA AGGTGACGCG CGCGGTTCCG TTCAACACCC CATGGCGCAC CGTGCGGATT 
GCCGACAATG CGAAGGGCAT CGTCGAGAAC GACCTCGAAC TGAACCTCAA CGAGCCGAAC 
AGGATCGGTG ACGTTTCGTA CTTCAAGCCG ATGAAGTACA TCGGCATCTG GTGGGGCATG 
ATCCGGGGCG ACTGGTCCTG GGCGGAAGGC CCGAAGCACG GCGCGACGAC CGCGCGGACC 
AAGCAGTACA TCGACTTCGC AGCCAGGCAC GGTTTTGGCG GGGTATTGGT GGAAGGCTGG 
GACAAGGGCT GGAACGGGAC CTGGTTCGGC AGCGGCAAGG AGTTCTCCTA TACCGAGGCG 
ACGCCCGACT TCGATCTTGA GGCAGTGACG AAATATGGCG CGAAGAAGGG CGTCATGCTG 
ATCGGCCATC ACGAGACGGG CGGCAACATC GCGAACTACG AGGCGCAGCT CGAGGACGCA 
ATGAAGCTCT ACGACAAGCT GGGCGTGCGC GCGGTGAAGA CCGGGTACGT CGCCGATGCG 
GGTGGCATCC TTGCACCAGG CGATGCGCCG GGCACCTACC GGATGGAGTA CCACGACGGG 
CAGCGGCAGG TGCAGCATCA CCTCAAGGTG GTCGAGATCG CCGCGAAGTA TCGCATCGCG 
ATCAACGCGC ACGAGCCGGT GAAGGACACC GGCCTTCGCC GCACATATCC CAACTGGATC 
GACCGCGAAG GCGCGCGCGG CATGGAATAC AACGCGTGGG GGCAGTTCGC CAACGGACCG 
GACCACGAGC CGACGCTGGT CTATACGCGG ATGCTGTCGG GGCCGATGGA CTACACCCCG 
GGCATCCTCA GCCTGGAAGG CGCCAACAAG GTGCCGCTGG CATCGACGCT CGCCAAGCAG 
CTCGGGCTGT ACCTTGCGAT CTATTCGCCG ATCCAGATGG CAGCGGATTT CATCGAGAGC 
CTCGAATCGC ACCCGAAGGA ACTGGCGTTC ATCAAACAGG TCCCGGCAGA TTGGTCCGAA 
AGCCACCTGA TCGCGGGCGA AGTTGGCGAC TATGCGATCT TCGCGCGCAA GGACCGCAAC 
AGCGAGGACT GGTACGTCGG CGGCGTCAAT GATGCGACGG CGCGCGACGT TTCGCTTTCC 
CTCGACTTCC TCGATCCCGG CAAGACCTAC ACCGCGACGG TGTGGAAGGA CGGCGAAGGC 
GCCACCTACG AAACCGAGGC ACGCCACCGG ATCGCCTATG CCACGCTCAA GGTGAAGAAG 
GGCGACGTGC TGCCCGCCTG GCTGGCGCCG GGAGGCGGAC TTGCGGTGCG CCTCCACCCG 
GGGAAGTAG

Protein sequence

MRNLLNVAAP LALTLSCALA TPATAETVTA TSPDGSLVLS VTTDNDGHPL YSLTRKGKLL 
LGSSMLGFIT SDGPTMQRGQ TIIGSEKGSG KETWEQPWGE RRYVTDNHNE LLVKFEQVPD 
WGGRRMNVRF RLFDDGFGFR YEIPEQPAMK VMKIADELTE FNVAQNGTAW WIPGGEWNRY 
EQVYQKTAID GVSTAHTPIT MKLADGTHLS FHEAALVDYS AMWLKRQTGT SFRATLSPSP 
NGPKVTRAVP FNTPWRTVRI ADNAKGIVEN DLELNLNEPN RIGDVSYFKP MKYIGIWWGM 
IRGDWSWAEG PKHGATTART KQYIDFAARH GFGGVLVEGW DKGWNGTWFG SGKEFSYTEA 
TPDFDLEAVT KYGAKKGVML IGHHETGGNI ANYEAQLEDA MKLYDKLGVR AVKTGYVADA 
GGILAPGDAP GTYRMEYHDG QRQVQHHLKV VEIAAKYRIA INAHEPVKDT GLRRTYPNWI 
DREGARGMEY NAWGQFANGP DHEPTLVYTR MLSGPMDYTP GILSLEGANK VPLASTLAKQ 
LGLYLAIYSP IQMAADFIES LESHPKELAF IKQVPADWSE SHLIAGEVGD YAIFARKDRN 
SEDWYVGGVN DATARDVSLS LDFLDPGKTY TATVWKDGEG ATYETEARHR IAYATLKVKK 
GDVLPAWLAP GGGLAVRLHP GK