Gene Spro_3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3103
Symbol
ID	5604553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	3414186
End bp	3415493
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	52%
IMG OID	640938643
Product	glycoside hydrolase family protein
Protein accession	YP_001479331
Protein GI	157371342
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.199701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAG TAACTTTTAT GGGCGCAGGC AGCACCATCT TCGCCAAGAA CGTACTCGGC 
GATATCATGG CAACGCCGGC ATTGAAAGAG GTGGATATCG CGCTGTACGA CATTGATAGC 
GCCCGTCTCA ATGAATCTTT CGCCATGCTC AGCAATATCA ATCGCAATAT TAACGCTGGC 
AGGGCGAAGA TCACTCCCTA CCTCGGGGTG GAAAATCGTC GTTCGGCGTT GAAAAATGCC 
AATTATGTGG TTAACGCCAT CCAGGTTGGC GGTTACGATC CTTGCACTAT CACCGATTTC 
ACCATTGCTA AAAAGTATGG CCTGCAGCAA ACCATTGCCG ATACCCTGGG GATAGGTGGC 
ATCTTCCGTG CGCTGCGCAC CATTCCGGTG ATGTTTGACT TCGCCCGGGA TATTGAAGCG 
GTATGTCCGG ATGCCTGGTT GCTGAACTAC ACCAACCCGA TGGCGGCCTT AACCGGCGCC 
ATGCTGCGCC ATACCGAAGT GAAAACGGTG GGGTTGTGTC ACAGTGTGCA GGTCTGTGCA 
GAGACGCTGC TGAAAAGCGT GGATATGCCT ACCGATGATG TCCAGTTCCA CATCGCAGGC 
ATTAACCATA TGGCCTGGTT GCTGGACGTT CGTCGCCATG GCGAGGATCT GTACCCGGAA 
ATCAAGCGTC GCGCCAATGC GCTGCAGGGC AAACATGATG ATATGGTGCG CCATGAAATC 
ATGAAAACCT TTGGCTATTA CGTTACCGAG TCTTCGGAAC ATAACGCCGA GTACATGCCT 
TATTGGATCA AGCGTAACTA TCCTGAATTG ATTGAGCGCT TTAACATTCC GCTGGACGAG 
TACCCGCGCC GCTGTGTTGA GCAGATTGAA CAATGGCAAC AGCGCAAGCT GGCGCTGACT 
AATGACGCCA ACCTGACTCA TACCCGCACT CATGAGTATG CGTCTTATAT TATTGAAGCG 
ATGGAAACCG ATCGCCCGTA CAAGATTGGT GGCAATGTGC TCAACAGCGG TTTAATTACC 
AACCTGCCTG CCGAGGCCTG TGTTGAAGTG CCTTGCCTGG TGGATGGGCA GGGCATCTCG 
CCCTGTTACG TCGGTCATTT ACCGGAGCAA CTGGCGGCGC TCAACCGCAC CAATATCAAT 
ACCCAACTTC TGACTATCGA AGCCGCAGTA ACCCATAAAC GCGAAGCGAT TTACCACGCG 
GCACTGCTGG ATCCGCATAC ATCTGCCGAG CTTTCGATTG ATGATATCCG TAAACTCTGC 
GATGAACTGA TTGAGGCCCA CGGTAACTGG CTTCCCGCCT ACCACTGA

Protein sequence

MIKVTFMGAG STIFAKNVLG DIMATPALKE VDIALYDIDS ARLNESFAML SNINRNINAG 
RAKITPYLGV ENRRSALKNA NYVVNAIQVG GYDPCTITDF TIAKKYGLQQ TIADTLGIGG 
IFRALRTIPV MFDFARDIEA VCPDAWLLNY TNPMAALTGA MLRHTEVKTV GLCHSVQVCA 
ETLLKSVDMP TDDVQFHIAG INHMAWLLDV RRHGEDLYPE IKRRANALQG KHDDMVRHEI 
MKTFGYYVTE SSEHNAEYMP YWIKRNYPEL IERFNIPLDE YPRRCVEQIE QWQQRKLALT 
NDANLTHTRT HEYASYIIEA METDRPYKIG GNVLNSGLIT NLPAEACVEV PCLVDGQGIS 
PCYVGHLPEQ LAALNRTNIN TQLLTIEAAV THKREAIYHA ALLDPHTSAE LSIDDIRKLC 
DELIEAHGNW LPAYH