Gene Avin_51810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_51810
Symbol	scrB
ID	7764018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	5277523
End bp	5279001
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	70%
IMG OID	643807997
Product	sucrose or/and sucrose-6-phosphate hydrolase
Protein accession	YP_002802231
Protein GI	226947158
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID	[TIGR01322] sucrose-6-phosphate hydrolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGCCG ACCTACTGGA CGAGGCGCAG CGCGCCATCG CGAGAACCCT GCCCGCACGC 
CGCGACGACT ACCGTCTCGG CTATCACCTG TCGCCGCCGG CCGGCTGGAT GAACGACCCG 
AACGGCCTGG TGTATTTCCG CGGCGAGTAC CATGTCTTCT ACCAGCACCA TCCGTATTCG 
CCCCAGTGGG GGCCGATGTA TTGGGGACAT GCCAGAAGCG CGGACCTGGT CCACTGGGAA 
CATCTGCCCA TCGCCCTGGC GCCCGGCGAT CCCTTCGACC GGGACGGCTG CTTTTCCGGT 
TCGGCGGTCG TCGACGGCGA TACCCTGTAC CTGATCTACA CCGGGCACCG CTGGCTGGGC 
GAAGCGGGCA ACGACGAGCA GGGCATGCGC CAGGTCCAGT GCCTGGCCAG CAGTACGGAC 
GGCATCGCCT TCACCAAGCA CGGCGCGGTG ATCGATACGC CGCCGCACCC GGACATCATG 
CATTTCCGCG ACCCCAGGGT CTGGCGACGC GGCGACCACT GGTGGATGGC GCTCGGCGCG 
CGCCAGGGCG ACGATCCGCT GCTGCTGCTC TACCGCTCCC GCGACCTGCG CCAGTGGGAC 
TGCCTCGGCC GCGCCCTGGA GGGCCGGCGG GAAGCCGACG GCTACATGTG GGAATGCCCG 
GACCTGTTCG AGCTGGAGGG ACGCGACGTC TTCCTGTTCT CGCCGCAGGG CCTGGAGCCC 
GACGGCCACG AACGCTGGAA CCTGTTCCAG AACGGCTACC GGCTGGGCCG GCTGGACGAG 
CGCGCGCGCT TCGTCGCGGA GAGCGAACTG CGCGAGATCG ACCACGGCCA CGATTTCTAC 
GCGGCGCAGA CCCTGCTGGC ACCGGACGGG CGCCGTCTGC TCTGGGCCTG GATGGACATG 
TGGCAAAGCC CGATGCCGAG CCAGGCCCAC CACTGGTGCG GCGCGCTGAC CCTGCCGCGC 
GAACTGAGCC GCGACGGCGA CCGGCTGCGC ATGCGCCCGG CCCGCGAACT GGCGGCGCTG 
CGCCAGTCCC GGCAGGCGCT GGCGATCGGC GCGCTCGAAT CCGGCAGCCG CACGCTGGAG 
GTTCGCGGCG CCCTGCTGGA GTTCGAACTC GAACTGGAAC TGACCGGCAG CAGCGCCGAG 
CGCTTCGGTC TGGCCCTGCG CTGCAGCGAC GACGGACGGG AGCGCACCTT GCTGTATTTC 
GACGCCATGG CCCGGCGCCT GGTGCTCGAC CGGCAGCATT CGGGAGCCGG CGTGAGCGGC 
GTGCGCAGCG TGCCGGTGGC GCCGGGGCAG ACGCGGATCG CCCTGCGCAT CTTCCTGGAC 
CGCTCGTCCA TCGAGGTATT CGTCGACGAC GGCGTCCATA CCCTGAGCAG CCGCATCTAT 
CCGCGTCCCG ACAGCCTGGG CGTGGGTGCC TTCGCCGTGA ACGGGCGCGG GGTGTTTGCC 
GAGGGCGCGG TCTGGAGCCT GGCCGATCTG AAACTCTGA

Protein sequence

MQADLLDEAQ RAIARTLPAR RDDYRLGYHL SPPAGWMNDP NGLVYFRGEY HVFYQHHPYS 
PQWGPMYWGH ARSADLVHWE HLPIALAPGD PFDRDGCFSG SAVVDGDTLY LIYTGHRWLG 
EAGNDEQGMR QVQCLASSTD GIAFTKHGAV IDTPPHPDIM HFRDPRVWRR GDHWWMALGA 
RQGDDPLLLL YRSRDLRQWD CLGRALEGRR EADGYMWECP DLFELEGRDV FLFSPQGLEP 
DGHERWNLFQ NGYRLGRLDE RARFVAESEL REIDHGHDFY AAQTLLAPDG RRLLWAWMDM 
WQSPMPSQAH HWCGALTLPR ELSRDGDRLR MRPARELAAL RQSRQALAIG ALESGSRTLE 
VRGALLEFEL ELELTGSSAE RFGLALRCSD DGRERTLLYF DAMARRLVLD RQHSGAGVSG 
VRSVPVAPGQ TRIALRIFLD RSSIEVFVDD GVHTLSSRIY PRPDSLGVGA FAVNGRGVFA 
EGAVWSLADL KL