Gene EcSMS35_3054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3054
Symbol
ID	6147474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3143753
End bp	3144748
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	54%
IMG OID	641617923
Product	arginine/ornithine transport system ATPase
Protein accession	YP_001745074
Protein GI	170683019
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1703] Putative periplasmic protein kinase ArgK and related GTPases of G3E family
TIGRFAM ID	[TIGR00750] LAO/AO transport system ATPase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAATG AAGCCACGCT GGCAGAAAGT ATTCGCCGCT TACGTCAGGG TGAGCGTGCC 
ACGCTCGCCC AGGCCATGAC CCTGGTGGAA AGCCGTCACC CGCGTCATCA GGCGCTAAGT 
ACGCAGCTGC TTGATGCCAT TATGCCGTTC TGTGGTAACG CCCTGCGACT GGGCGTTACC 
GGCACACCCG GCGCGGGGAA AAGTACCTTT CTTGAAGCCT TTGGCATGTT GTTGATTCGT 
GAGGGACTAA AGGTTGCGGT TATTGCGGTC GATCCCAGCA GCCCGGTCAC TGGCGGTAGC 
ATTCTCGGGG ATAAAACCCG CATGAATGAC CTGGCGCGTG CCGAGGCGGC GTTTATTCGC 
CCGGTACCAT CCTCCGGTCA TCTGGGCGGT GCCAGTCAGC GAGCGCGGGA ATTAATGCTG 
TTATGCGAAG CGGCGGGTTA TGATGTAGTG ATTGTCGAAA CGGTTGGCGT CGGGCAGTCG 
GAAACGGAAG TCGCCCGCAT GGTGGACTGT TTTATCTCGT TGCAAATTGC CGGTGGTGGC 
GATGATCTGC AGGGCATTAA AAAGGGGCTG ATGGAAGTGG CAGATCTGAT CGTTATCAAC 
AAAGACGATG GCGATAACCA TACCAATGTC GCCATTGCCC GGCATATGTA CGAGAGTGCC 
CTGCATATTC TGCGACATAA ATACGACGAA TGGCAGCCAC GAGTTCTGAC TTGTAGCGCA 
CTGGAAAAAC GTGGAATCAA TGAGATCTGG CACGCCATCA TCGACTTCAA AACCGCGCTA 
ACTGCCAGTG GTCGTTTGCA ACAAGTGCGG CAACAACAAT CGGTGGAATG GCTGCGTAAA 
CAAACCGAAG AAGAAGTACT GAATCACCTG TTCGCGAATG AAGATTTCGA TCGCTATTAC 
CGCCAGACGC TTTTAGCGGT CAAAAACAAT ACGCTCTCAC CGCGCACCGG CCTGCGGCAG 
CTCAGTGAAT TTATCCAGAT GCAATATTTT GATTAA

Protein sequence

MINEATLAES IRRLRQGERA TLAQAMTLVE SRHPRHQALS TQLLDAIMPF CGNALRLGVT 
GTPGAGKSTF LEAFGMLLIR EGLKVAVIAV DPSSPVTGGS ILGDKTRMND LARAEAAFIR 
PVPSSGHLGG ASQRARELML LCEAAGYDVV IVETVGVGQS ETEVARMVDC FISLQIAGGG 
DDLQGIKKGL MEVADLIVIN KDDGDNHTNV AIARHMYESA LHILRHKYDE WQPRVLTCSA 
LEKRGINEIW HAIIDFKTAL TASGRLQQVR QQQSVEWLRK QTEEEVLNHL FANEDFDRYY 
RQTLLAVKNN TLSPRTGLRQ LSEFIQMQYF D