Gene EcolC_1468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1468
Symbol
ID	6067242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1618876
End bp	1619901
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	53%
IMG OID	641600888
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001724458
Protein GI	170019504
COG category	[R] General function prediction only
COG ID	[COG4239] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000790283
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.119666
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGAC TCAGCCCCGT CAATCAGGCC CGTTGGGCGC GTTTTCGCCA TAACCGTCGC 
GGCTACTGGT CGTTATGGAT TTTCCTCGTT TTGTTTGGTT TGAGTTTGTG TTCTGAACTT 
ATCGCTAACG ATAAACCGTT GCTGGTGCGT TATGACGGCA GTTGGTATTT CCCGTTGTTG 
AAAAACTACA GCGAAAGCGA TTTTGGCGGC CCGCTGGCAA GTCAGGCTGA TTATCAGGAC 
CCGTGGCTGA AACAACGGCT GGAAAATAAC GGCTGGGTAC TGTGGGCACC GATTCGCTTT 
GGTGCTACCA GTATCAACTT TGCTACCGAT AAGCCCTTCC CTTCTCCACC CTCCCGGCAA 
AACTGGCTGG GAACGGATGC CAACGGCGGC GATGTGCTGG CACGCATTCT CTATGGCACG 
CGGATCTCGG TTCTGTTTGG CCTGATGCTG ACTCTCTGTT CCAGCGTGAT GGGCGTGCTG 
GCGGGGGCGC TACAAGGCTA TTACGGCGGT AAAGTCGATC TCTGGGGACA ACGCTTTATT 
GAAGTATGGT CGGGGATGCC GACGCTGTTT TTGATTATTT TACTTTCCAG CGTCGTACAG 
CCTAACTTCT GGTGGCTGCT GGCAATTACT GTCTTGTTTG GCTGGATGAG TCTGGTCGGC 
GTGGTGCGGG CGGAGTTTTT ACGTACTCGT AATTTCGACT ACATTCGTGC GGCACAGGCG 
CTTGGCGTCA GCGATCGCAG TATCATCCTG CGTCATATGT TGCCTAATGC CATGGTCGCG 
ACCCTCACCT TTTTACCGTT TATTTTATGT AGTTCGATAA CCACCCTGAC CTCGCTCGAT 
TTCCTCGGCT TCGGTCTACC GCTCGGTTCA CCGTCACTCG GTGAACTGCT GTTACAAGGG 
AAAAATAACC TTCAGGCCCC GTGGCTTGGG ATCACCGCCT TCTTGTCGGT GGCGATATTA 
TTGTCTTTGC TGATCTTTAT TGGTGAAGCC GTCCGCGACG CATTTGATCC TAATAAGGCG 
GTGTAG

Protein sequence

MSRLSPVNQA RWARFRHNRR GYWSLWIFLV LFGLSLCSEL IANDKPLLVR YDGSWYFPLL 
KNYSESDFGG PLASQADYQD PWLKQRLENN GWVLWAPIRF GATSINFATD KPFPSPPSRQ 
NWLGTDANGG DVLARILYGT RISVLFGLML TLCSSVMGVL AGALQGYYGG KVDLWGQRFI 
EVWSGMPTLF LIILLSSVVQ PNFWWLLAIT VLFGWMSLVG VVRAEFLRTR NFDYIRAAQA 
LGVSDRSIIL RHMLPNAMVA TLTFLPFILC SSITTLTSLD FLGFGLPLGS PSLGELLLQG 
KNNLQAPWLG ITAFLSVAIL LSLLIFIGEA VRDAFDPNKA V