Gene Spro_2297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2297
Symbol
ID	5604780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	2499917
End bp	2501167
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	58%
IMG OID	640937836
Product	extracellular solute-binding protein
Protein accession	YP_001478526
Protein GI	157370537
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.33558
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGCC ATACCCTTGC CGCTACGGCA GTCTGTACCC TGTCGCTCCT GGCGCTTAGC 
CTGTCATCTG CCTATGCCGC CCCGACGCAA ATTAACGCGT TGTTTATGAC CCAGGCGGCG 
TACAGCGAAA ATGATATCCG TGCCATGACC GCCGATTTTA GCAAGCAGCA CCCGGATATC 
ACCGTTAACC TGGAGTTCGT TCCTTACGAG GCGCTGCACG ATAAAATCGT CGCGGCGCGC 
GGTGCCGGCA GTAACGGCTA CGATGTGGTG CTGTTCGACG CCATCTGGCC GGCAGAATTC 
ACCAAGTTCG GCCTGCTGCA GGACGTAACC TCGCGCATCA GCGCCGACGA CAGCGCCAAA 
ATCTTTGCCG GCGCCATGAC CACCGTCACC TATAAGGACA AGCGCTGGGG CATGCCGTGG 
ATCCTCGACA CCAAATACCT GTATTACAAC AAAGCCATGC TGGCCAAGGC CGGGATTGCC 
GCCCCGCCGA AAACCTGGCA GGAACTGGCG CAGCAGGCAG AGATCCTGAA GCAAAAAAAC 
GTGGTCAAAT ACCCGCTGGT ATGGAGCTGG TCACAGGCCG AGGCACTGGT TTGCGATTAC 
ACCACCCTGG TGTCTGCCTA TAAGGGGCAG TTTATCCAGC AGGGGAAAAT CACCTTCTCC 
AGCCCAGGTT CACTGCAGGC CGTCGACTAT ATGAAAGCGT CGCTGGACAA GGGGCTGACC 
AATCCGAACT CCCGCGAATA TCTGGAAGAG GACGTGCGCA AAGCGTTTTC CAACGGTGAC 
GCGGCCTTCG CCCTTAACTG GACCTACATG TACAACATGG CCAACGATCC CAAGCAAAGC 
AAAGTGGCCG GTGACGTCGG CATCGTGCCG GCTCCGGGAT CGGTGGCGGG TCAGGTCTCT 
GCGGTTAACG GTTCGATGGG GCTAGGCATC GCCAAGGCCA GCGCCCACCC CGATCAGGCC 
TGGCAATACA TCAGCTACAT GACCTCACAG CCGGTGCAGG ACAAATACGC CAAACTAAGC 
CTGCCGATCT GGAAGTCGTC TTACGACGAT CCGACGGTGC AGAAGGGTCA GGAGCCGTTA 
ATCGCCGCCG CCAAACAGTC GTTGAACGTG ATGCTGTCGC GCCCTGAAAC CGCCGATTAC 
TCTCGTTTGT CCAACGGCCT GCAACAGGAC TTGCAGCAAA TTCTGCAGGG CAAGGTAACG 
CCGCAGGCCG GGCTGGATGC GGCCACCCAA AGCGCTGCGC GGCTACGTTA A

Protein sequence

MKSHTLAATA VCTLSLLALS LSSAYAAPTQ INALFMTQAA YSENDIRAMT ADFSKQHPDI 
TVNLEFVPYE ALHDKIVAAR GAGSNGYDVV LFDAIWPAEF TKFGLLQDVT SRISADDSAK 
IFAGAMTTVT YKDKRWGMPW ILDTKYLYYN KAMLAKAGIA APPKTWQELA QQAEILKQKN 
VVKYPLVWSW SQAEALVCDY TTLVSAYKGQ FIQQGKITFS SPGSLQAVDY MKASLDKGLT 
NPNSREYLEE DVRKAFSNGD AAFALNWTYM YNMANDPKQS KVAGDVGIVP APGSVAGQVS 
AVNGSMGLGI AKASAHPDQA WQYISYMTSQ PVQDKYAKLS LPIWKSSYDD PTVQKGQEPL 
IAAAKQSLNV MLSRPETADY SRLSNGLQQD LQQILQGKVT PQAGLDAATQ SAARLR