Gene Spro_1910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_1910
Symbol
ID	5606490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2093484
End bp	2094509
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	55%
IMG OID	640937446
Product	aminodeoxychorismate lyase
Protein accession	YP_001478141
Protein GI	157370152
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000953369
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000738863
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAGAAAA GAAAGCTGAA GTTCGTTTCT ATTATTGTTG TTCTGGTATT GGGCCTGCTG 
TTTTGGGGCT ACCAGAAGGT TGAACGCTTC GCGGATACGC CACTGGCGAT CCAGCAGGAA 
GCCATTTTCA AACTGCCGGC AGGGACCGGT CGGGTAGCCC TGGAGGGGCT GCTGGTGCGG 
GACAAACTGA TCCGCAATGG CCAGTGGTTC CCTTGGTTGC TGCGCCTGGA GCCGGAATTG 
GCCGAGTTTA AGGCTGGAAC CTATCGCTTT ACGCCGGGTA TGACGGTGCG TCAAATGCTT 
AAACTGTTGG CCAGCGGTAA AGAAGCCCAA TTCAGCGCAC GCTTTATTGA AGGTTCCCGC 
CTGCGGGACT GGCTGCTGGT GCTGCAACAG TCAAAATACC TCAAACATAC CCTGGCCGGT 
AAAAGCGAGG CGGAAATTGC CAAGGCGCTA GGCTTGCCAG AAGGCGCCAA CCCAGAAGGG 
CGCCTGTACC CGGATACCTA TCTGTATACC GCAGGCATGA GCGATATGGC GCTGTTGAAG 
CGTGCCCACC TGCGTATGAT TAAAGCATTG GAGAGCGCCT GGCAGGGCCG TGAGGCCAGT 
TTGCCGTACA AAACGCCGGA AGAGTTGCTG ACCATGGCCT CAATCATTGA GAAAGAGACT 
GCGGTACCGG AGGAACGTAC CAAAGTGGCC TCGGTATTCA TTAATCGCCT GCGTATTGGC 
ATGCGTTTGC AGACCGACCC GACGGTGATC TACGGCATGG GCGAGGCGTA TAATGGCAAC 
ATTACCCGCA AGGATTTGGA AACGCCGACG CCGTACAACA CCTACGTGAT CAACGGTCTG 
CCGCCAACGC CGATTGCCAT GCCAAGCCAG GCTTCGCTGG AGGCCGCTGC CAATCCGGCC 
AAGACGCCTT ATTTGTACTT TGTTGCCGAC GGTAAGGGCG GGCATCAATT TACCACCAAC 
CTGGCCAGCC ATAATCAGGC GGTGCGTGCC TATCGTCAGG CGTTAAAGGA AAAGAATGAA 
AAGTAA

Protein sequence

MKKRKLKFVS IIVVLVLGLL FWGYQKVERF ADTPLAIQQE AIFKLPAGTG RVALEGLLVR 
DKLIRNGQWF PWLLRLEPEL AEFKAGTYRF TPGMTVRQML KLLASGKEAQ FSARFIEGSR 
LRDWLLVLQQ SKYLKHTLAG KSEAEIAKAL GLPEGANPEG RLYPDTYLYT AGMSDMALLK 
RAHLRMIKAL ESAWQGREAS LPYKTPEELL TMASIIEKET AVPEERTKVA SVFINRLRIG 
MRLQTDPTVI YGMGEAYNGN ITRKDLETPT PYNTYVINGL PPTPIAMPSQ ASLEAAANPA 
KTPYLYFVAD GKGGHQFTTN LASHNQAVRA YRQALKEKNE K