Gene EcE24377A_1482 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1482
Symbol
ID	5588164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1472287
End bp	1473456
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	52%
IMG OID	640925174
Product	tetratricopeptide repeat protein
Protein accession	YP_001462579
Protein GI	157157418
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000000455068
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGAGT TGTTGTTTCT GCTTTTGCCT GTAGCCGCTG CCTATGGCTG GTATATGGGC 
CGCAGAAGTG CGCAACAAAA CAAGCAAGAT GAAGCCAACC GCTTGTCGCG TGATTACGTA 
GCGGGGGTTA ACTTCCTGCT TAGTAATCAA CAGGATAAAG CGGTAGACCT GTTTCTCGAT 
ATGCTTAAAG AGGATACAGG CACCGTTGAA GCCCACCTTA CGCTCGGAAA CCTGTTCCGT 
TCGCGTGGCG AAGTTGATCG CGCTATTCGC ATCCATCAGA CCCTAATGGA AAGCGCCTCG 
CTGACCTATG AACAGCGTCT GTTGGCGATT CAACAACTGG GGCGTGATTA CATGGCCGCC 
GGGTTATACG ACCGCGCGGA AGACATGTTC AATCAGCTGA CCGATGAAAC TGACTTCCGC 
ATTGGCGCGC TGCAACAGTT GCTACAAATC TACCAGGCTA CCAGTGAGTG GCAGAAAGCA 
ATTGATGTTG CCGAACGCCT GGTGAAGCTG GGTAAAGATA AACAGCGCGT CGAAATTGCC 
CATTTCTACT GTGAGTTAGC CCTGCAGCAT ATGGCCAGCG ACGATCTCGA TCGTGCCATG 
ACCTTGCTAA AAAAAGGGGC GGCGGCAGAT AAAAACAGCG CCCGCGTATC CATCATGATG 
GGACGCGTGT TTATGGCGAA AGGAGAATAC GCCAAAGCCG TCGAAAGTTT GCAACGCGTG 
ATATCCCAGG ACAGAGAACT GGTCAGCGAA ACGCTGGAAA TGTTGCAAAC CTGCTATCAG 
CAGTTGGGTA AAACTGCCGA ATGGGCAGAA TTCCTGCAAC GCGCGGTGGA AGAGAACACC 
GGTGCCGATG CTGAATTGAT GCTTGCTGAT ATCATCGAAG CGCGCGACGG TAGTGAGGCC 
GCACAGGTCT ATATTACGCG CCAGCTTCAG CGTCATCCGA CCATGCGTGT GTTCCATAAG 
TTAATGGATT ACCACTTAAA TGAAGCGGAA GAAGGGCGTG CCAAAGAGAG CCTGATGGTG 
CTGCGTGACA TGGTTGGCGA AAAGGTACGT AGTAAGCCTC GTTATCGCTG CCAGAAATGT 
GGTTTTACCG CATACACCCT CTACTGGCAT TGTCCGTCTT GTCGGGCCTG GTCAACCATT 
AAACCGATTC GCGGTCTTGA TGGCCTGTAA

Protein sequence

MLELLFLLLP VAAAYGWYMG RRSAQQNKQD EANRLSRDYV AGVNFLLSNQ QDKAVDLFLD 
MLKEDTGTVE AHLTLGNLFR SRGEVDRAIR IHQTLMESAS LTYEQRLLAI QQLGRDYMAA 
GLYDRAEDMF NQLTDETDFR IGALQQLLQI YQATSEWQKA IDVAERLVKL GKDKQRVEIA 
HFYCELALQH MASDDLDRAM TLLKKGAAAD KNSARVSIMM GRVFMAKGEY AKAVESLQRV 
ISQDRELVSE TLEMLQTCYQ QLGKTAEWAE FLQRAVEENT GADAELMLAD IIEARDGSEA 
AQVYITRQLQ RHPTMRVFHK LMDYHLNEAE EGRAKESLMV LRDMVGEKVR SKPRYRCQKC 
GFTAYTLYWH CPSCRAWSTI KPIRGLDGL