Gene Spro_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2007
Symbol
ID	5603458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	2197614
End bp	2198999
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	55%
IMG OID	640937545
Product	glycoside hydrolase family protein
Protein accession	YP_001478238
Protein GI	157370249
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0536804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAA CCGTTCTGGG CGGCGGCGGC GTGCGTTCGC CGTTCCTGGC CAAATCTATC 
GCCTACAACG CCCACCGTAT CGGCGTCACT GAAGTGGTGT TTATGGACAC CGATCAACAT 
AAACTGGCCA TCTACGGTGC CATCGCTCAG GGGGTATTCC AGCGTATTCG CAGCGATATC 
GCCTTCAGCC TGACCAGCGA TGCGCATCAG GCATTGAGCG GTGCAGACTA TATCATCACC 
ACCCTGCGTA TCGGCGGCGA AGAGGGGCGT ATTGATGATG AACGCATCGC GCTCAACCAT 
CAGGTTCTGG GGCAGGAAAC CACCGGTGCC GGCGGCTTCG CCATGGCAAT GCGTTCAATC 
CCGGCGATTA TCGATTACTG CCGACTGATC GAACAGCTGT CGTCACCCGA TGCAGTGCTA 
TTCAACTTCA CTAACCCTTC CGGTATGGTG ACCGAAGCTA TCATCAAGTC AGGCTTTAAA 
CGCCAGGTGT ACGGTATCTG CGATGCGCCC AGCGAGTTTA TCCGCGAACT GGCCGAGTTG 
TTGGGTTGCC GCGAGAGTGA ATTGAGTATC GACTGCTTTG GCCTGAACCA CCTGTCCTGG 
TTCCGCAATG CCAGGGTCAA CGGTGAACCG GTAACCGAAC GGCTGCTGGC GGACCCGCGC 
CTGTACCGCG ACACCTGCAT GAAATACTTC TCACCGGAGC TGGTCGAACT CTCCGATAAC 
CTGATGCTCA ACGAGTATCT GTATTACTAC TACTATCGCG AGCAAGCGAT CGCCGCTATC 
GTCAGCGCCG GAGAAACCCG CGGCGAGCAA ATTGCGCAGA TCAATCGGCA GATGCTGGCA 
GACCTGGCCG AGCTGGACAT CCCGAACCAG CTGGATCAGG CCTTCAGCCT CTACTTCAGC 
CATTATCTGA CGCGCGAAAA CTCGTATATG CAGCGCGAGT CCAACCAGGG CAAGGTGAAA 
GAGCGCACCA TGCTGACGCT GCAACAGTTT ATCGAACAGC CGGACAGCGG TGGCTACGCC 
GGGGTGGCGA TCGATATTCT GGAGGCGGTG AACAGCGGCC AACAAAAACG CGTGGTGGTG 
TCGATGCAAA ACAACGACAC GCTGGACTTT CTGCATCCTG AGGACGTGAT CGAAATCAGC 
TGTGAACTAA GCAGTGCGGG CATTCACCCG GTGAAAATGC GCGATATTCC CGATACGCAA 
AAAAACCTGA TCGCTCGGGT GAAAGAGTAC GAACGGTTGG CAGTAGAAGC GATTCTTGAA 
GGTAACCGTA AAAAAGCCAT CAAAGCCTTG ATGGTGCACC CGCTAGTGAA TTCTTACTCG 
CTAGCGAAAA CGCTGGTGGA GGAGTATCTG CAGGCCCATC GGCAATATGC CGAACACTGG 
CGTTAA

Protein sequence

MKLTVLGGGG VRSPFLAKSI AYNAHRIGVT EVVFMDTDQH KLAIYGAIAQ GVFQRIRSDI 
AFSLTSDAHQ ALSGADYIIT TLRIGGEEGR IDDERIALNH QVLGQETTGA GGFAMAMRSI 
PAIIDYCRLI EQLSSPDAVL FNFTNPSGMV TEAIIKSGFK RQVYGICDAP SEFIRELAEL 
LGCRESELSI DCFGLNHLSW FRNARVNGEP VTERLLADPR LYRDTCMKYF SPELVELSDN 
LMLNEYLYYY YYREQAIAAI VSAGETRGEQ IAQINRQMLA DLAELDIPNQ LDQAFSLYFS 
HYLTRENSYM QRESNQGKVK ERTMLTLQQF IEQPDSGGYA GVAIDILEAV NSGQQKRVVV 
SMQNNDTLDF LHPEDVIEIS CELSSAGIHP VKMRDIPDTQ KNLIARVKEY ERLAVEAILE 
GNRKKAIKAL MVHPLVNSYS LAKTLVEEYL QAHRQYAEHW R