Gene EcE24377A_C0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_C0004
Symbol	traH
ID	5585717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009787
Strand	-
Start bp	11467
End bp	12972
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	51%
IMG OID	640913795
Product	conjugal transfer pilus assembly protein TraH
Protein accession	YP_001451445
Protein GI	157149420
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATCAT CACCACGGAG CAGGCCCGCG AAATTGCGAT CCGCTGTCAT GAACGGCAGA 
TTCAGCATCA GCAACGCTGG GTTACCTGAA GGTATTTATT TTCGGACGTT TCCCTCTTTA 
TTTACGAAAG GGGGAGCAAT GAAAACTTTC CTGAGACAAT CATTTCTCTC GCTGCTCATT 
GGCACTGCGT TGTGCACGTC CGCCAGTGCC GGGCTGCAGG ATGACATGAA TTCGTTTTTT 
AACAATATGA GCTATGCCAG CAACGCCACC TCAGCGAAAG CATGGCAGGG ACAGGCGGCA 
CGCTATGTAA CCGGCGGTTC GTTCTATGCC CGCACAGGAA ACAAAAATAT CCAGCTGATA 
TCCATCAGCC TGCCGTCCAT CAACGCCGGA TGTGGCGGGA TTGATGTCTA TCTTGGGTCT 
TTCTCCTTTA TTAACTCCGA CCAGATTATG GCGTTTGTGA AACAGACGAT GGCTAACGCG 
GCGGGGTACT TTTTCGACCT TGCACTGGAA ACTACCGTGC CTGAGTTGAA AGCGGCAAAA 
GACTTCCTGC AGAAGATGGC TGCTGACCTT AACCGTTTCA ATATGTCCAG CTGTCAGGCG 
GCAAAAGCGA TGGTCGACAG CGTGGCGTCG CTGTGGGGGG AAAGTCAGCA GAACGTCTGC 
CAGTCTGTCG CCGGTCAGAA TAACGTGTTC TCGGACTGGG TCTCCTCCCG TCAGGGCTGC 
ACATCCGGCG GGAAATACGA AAGCGTCACG AACAAGGCTA CCGGCGCAGA AAAAGATCAG 
GTCCTGAAGG ATATCAACCT GATGTGGGAT GCTCTCAGCA ACAGTACGCT CAGCAGCAAT 
GCAGAGTTAC GCCAGTTTGC CATGAGCATC AGCGGTTCGG TGATTTTCGG CAGTAACGGG 
GAAATGCGAA TCCTGTCTTC GCTGGCATCA GACCGCAGCC TGTTGAGTGC GATGATGAGT 
GGTGGCAGCG CCAAAGTGTA CGTCTGTGAT AACCAGAACA AATGTCTGTC ACCCTCCCTG 
AATAACGTGA CCATTTCGGA GTCAAAATCT CTGATCCGCA TGGTGCGGGA CACGCTGACC 
AGCATAGAAA ATAAAGCCAT TACGGACACA CCATTGACGG AGAGAGAGAA GCAGTTCATC 
AACAGCACCT CCATTCCCAT CCTGTCCTGG ATAGTGGATC AGTCATCCCT GAGTGTTTCG 
CAGTCCCTGT TTGCTCAGCT GACGGATTAC ATCGCCGTCG ATATTTATCT GCAGTATCTG 
GAAGCTGTCA TGAAGGTGGT CAATGGTTCA CTGGCTACCA AAGACTATCC GGGGGCCAAT 
ATGAATGAAC TGAAAAATGG CCTGGCAGAT GCGCGCCAGG CGCTCAACTC ACTGCGTATG 
GAGGTTCAGA TTAAGGAAAA TGCGCTTATT TCTGCACAAC AGCAAATCCG TTTTATCCGC 
CAGCAGGTCT CCTCAAAAAT GAGCGATCGC GTACTCGGTA ACTATCAGTT CAGCAGGGTG 
AATTAA

Protein sequence

MTSSPRSRPA KLRSAVMNGR FSISNAGLPE GIYFRTFPSL FTKGGAMKTF LRQSFLSLLI 
GTALCTSASA GLQDDMNSFF NNMSYASNAT SAKAWQGQAA RYVTGGSFYA RTGNKNIQLI 
SISLPSINAG CGGIDVYLGS FSFINSDQIM AFVKQTMANA AGYFFDLALE TTVPELKAAK 
DFLQKMAADL NRFNMSSCQA AKAMVDSVAS LWGESQQNVC QSVAGQNNVF SDWVSSRQGC 
TSGGKYESVT NKATGAEKDQ VLKDINLMWD ALSNSTLSSN AELRQFAMSI SGSVIFGSNG 
EMRILSSLAS DRSLLSAMMS GGSAKVYVCD NQNKCLSPSL NNVTISESKS LIRMVRDTLT 
SIENKAITDT PLTEREKQFI NSTSIPILSW IVDQSSLSVS QSLFAQLTDY IAVDIYLQYL 
EAVMKVVNGS LATKDYPGAN MNELKNGLAD ARQALNSLRM EVQIKENALI SAQQQIRFIR 
QQVSSKMSDR VLGNYQFSRV N