Gene EcolC_3922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3922
Symbol
ID	6064406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4309617
End bp	4310633
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	55%
IMG OID	641603335
Product	phosphonate ABC transporter, periplasmic phosphonate binding protein
Protein accession	YP_001726850
Protein GI	170021896
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3221] ABC-type phosphate/phosphonate transport system, periplasmic component
TIGRFAM ID	[TIGR01098] phosphate/phosphite/phosphonate ABC transporters, periplasmic binding protein [TIGR03431] phosphonate ABC transporter, periplasmic phosphonate binding protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTA AGATAATTGC CTCGCTGGCC TTCACCAGCA TGTTCAGCCT CAGCACCCTG 
TTAAGCCCGG CACACGCCGA AGAGCAGGAA AAGGCGCTGA ATTTCGGCAT TATTTCAACG 
GAATCACAGC AAAACCTGAA ACCGCAATGG ACGCCATTCT TACAGGATAT GGAGAAGAAG 
CTGGGCGTGA AGGTGAACGC CTTCTTTGCC CCAGACTACG CAGGCATTAT CCAGGGAATG 
CGCTTCAATA AAGTGGATAT CGCCTGGTAC GGCAACCTGT CGGCAATGGA AGCGGTGGAT 
CGCGCCAACG GCCAGGTCTT CGCCCAGACG GTCGCGGCGG ATGGATCGCC AGGTTACTGG 
AGCGTGTTGA TCGTCAACAA AGATAGTCCG ATCAACAACC TGAACGATCT GCTGGCGAAG 
CGGAAAGATC TCACCTTCGG CAATGGCGAT CCTAACTCCA CCTCTGGCTT CCTCGTCCCC 
GGTTACTACG TCTTCGCCAA AAACAATATC TCCGCCAGCG ACTTCAAGCG CACCGTCAAC 
GCCGGGCATG AAACCAACGC GCTGGCCGTC GCCAACAAGC AGGTGGATGT GGCGACCAAC 
AACACCGAAA ACCTCGACAA GCTGAAAACC TCCGCGCCGG AGAAGCTGAA AGAACTGAAA 
GTGATCTGGA AATCGCCGCT GATCCCAGGC GATCCGATCG TCTGGCGTAA AAATCTTTCC 
GAAACCACCA AAGACAAGAT CTACGACTTC TTTATGAATT ACGGCAAAAC GCCGGAAGAG 
AAAGCGGTGC TGGAACGCCT GGGCTGGGCG CCGTTCCGCG CCTCCAGCGA CCTGCAACTG 
GTGCCGATTC GCCAGCTCGC ACTGTTTAAA GAGATGCAGG GCGTGAAAAG CAATAAAGGA 
CTGAATGAGC AGGACAAGCT GGCAAAAACC ACCGCGATTC AGGCGCAACT GGATGACCTG 
GACCGCCTGA ACAACGCGCT AAGCGCGATG AGTTCGGTGA GTAAAGCGGT GCAGTAA

Protein sequence

MNAKIIASLA FTSMFSLSTL LSPAHAEEQE KALNFGIIST ESQQNLKPQW TPFLQDMEKK 
LGVKVNAFFA PDYAGIIQGM RFNKVDIAWY GNLSAMEAVD RANGQVFAQT VAADGSPGYW 
SVLIVNKDSP INNLNDLLAK RKDLTFGNGD PNSTSGFLVP GYYVFAKNNI SASDFKRTVN 
AGHETNALAV ANKQVDVATN NTENLDKLKT SAPEKLKELK VIWKSPLIPG DPIVWRKNLS 
ETTKDKIYDF FMNYGKTPEE KAVLERLGWA PFRASSDLQL VPIRQLALFK EMQGVKSNKG 
LNEQDKLAKT TAIQAQLDDL DRLNNALSAM SSVSKAVQ