Gene Spro_1421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_1421
Symbol
ID	5606609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	1552436
End bp	1553704
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	58%
IMG OID	640936953
Product	putative substrate-binding periplasmic transport protein
Protein accession	YP_001477653
Protein GI	157369664
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGTC GTCACTTTAT AAAAGCTTTC GCGCTGTCTG CCAGCATGGT CGGTATGGGG 
ATCGCCTGGA GCGTGCAGGC TGCCGATACC ATCAAGGTCG GCATCCTGAG TTCGCTGTCC 
GGCACCATGG CCATTTCTGA AACGCCGCTC AAGGACGTGG CACTGATGAC CATTGATGAC 
ATCAATGCCA AGGGCGGCGT ATTGGGTAAA AAACTCGAAC CGGTGGTGGT GGATCCGGCC 
TCCAACTGGC CGCTGTTCGC CGAAAAGGCG CGTCAGTTGC TGAGCCAGGA CAAGGTGGCG 
GCGGTGTTTG GCTGCTGGAC TTCGGTATCG CGTAAATCCG TGTTGCCGGT GTTTGAAGAG 
TTGAACGGTT TGCTGTTCTA CCCGGTGCAA TACGAAGGGG AAGAGATGTC GCCCAATGTG 
TTCTATACCG GTGCGGCCCC TAATCAGCAG GCGATCCCGG CGGTGGAATA CCTGCTGAGC 
GAAGACGGCG GATCGGCGAA ACGCTTCTTC CTGCTGGGCA CTGACTACGT TTATCCGCGT 
ACCACCAACA AGATCCTGCG CGCCTTCCTG CACTCGAAAG GCATTCAGGA TAAAGACATC 
GAAGAGGTCT ATACGCCGTT TGGTTACAGC GACTACCAGA CCATTGTCGC CAACATCAAG 
AAATTCTCTG CCGGTGGCAA AACGGCGGTG ATCTCCACCA TCAACGGTGA TTCCAACGTC 
CCCTTCTACA AAGAGCTGGC CAATCAGGGC ATCAAGGCCA CCGACGTGCC AGTGATCGCC 
TTCTCGGTAG GGGAAGAAGA GCTGCGCGGC ATCGACACCA AACCGCTGGT GGGTAACCTG 
GCGGCCTGGA ACTACTTCGA ATCGGTGGAT AACCCGACCA ACAAGCAGTT CGTCAGCGAA 
TGGCGCGCTT ACGCCAAGGC GCATAACCTG CCGAACTATG CCACCGCCGT GACCAATGAC 
CCGATGGAAA CCACCTATGT CGGCATCCAC ATGTGGGCGC AGGCGGTCGA GAAGGCCGGA 
ACCACGGACG TGGATAAGGT TCGTGCGGCG ATGGCCGGGC AGACCTTCGC CGCGCCGTCG 
GGCTTTACCC TGACTATGGA TGCTACCAAC CATCACCTGC ACAAACCGGT GATGATTGGC 
GAGATTGAAG GCAACGGCCA GTTCAACGTG GTGTGGCAAA CCGATGCTCC GGTACGCGCC 
CAGCCGTGGA GCCCGTACAT TGCCGGCAAC GACAAAAAGT CGGAAAGCCC GGTAAAAGGC 
GGCAAGTAA

Protein sequence

MQRRHFIKAF ALSASMVGMG IAWSVQAADT IKVGILSSLS GTMAISETPL KDVALMTIDD 
INAKGGVLGK KLEPVVVDPA SNWPLFAEKA RQLLSQDKVA AVFGCWTSVS RKSVLPVFEE 
LNGLLFYPVQ YEGEEMSPNV FYTGAAPNQQ AIPAVEYLLS EDGGSAKRFF LLGTDYVYPR 
TTNKILRAFL HSKGIQDKDI EEVYTPFGYS DYQTIVANIK KFSAGGKTAV ISTINGDSNV 
PFYKELANQG IKATDVPVIA FSVGEEELRG IDTKPLVGNL AAWNYFESVD NPTNKQFVSE 
WRAYAKAHNL PNYATAVTND PMETTYVGIH MWAQAVEKAG TTDVDKVRAA MAGQTFAAPS 
GFTLTMDATN HHLHKPVMIG EIEGNGQFNV VWQTDAPVRA QPWSPYIAGN DKKSESPVKG 
GK