Gene Emin_1142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1142
Symbol
ID	6262603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1241186
End bp	1242181
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	38%
IMG OID	642611622
Product	TPR repeat-containing protein
Protein accession	YP_001876031
Protein GI	187251549
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT TGTTTATTTT AGCTGTTTTA TGTTTAAGTG TTTTTACAAT AGGCTGCGGC 
AGCAATAACG CTAACTTTAA GAAAGCTTTG TATTATACCG ACATCGGCCG GTATAATGAT 
GCTTTAAACC TTTACGGTAA AATAATAAAA TCCGATCCTA ATAACTATGC CGCGTATTCC 
AACCGCGCCA TGGTGCATGA AAAAATTGCG GCCGCTATTT CTTTTAAAGA TTTAAAACTC 
AGGCAGCAGC ATCTTGATTA CGCTGAAAAA GACTATTTAA AAGCGGTAAA ACTTAATCCT 
AACGACGCTA AAATTTTAAA TAATTTAGGA GCTTTTTATA TTGACAGAGG CCAGTATTAT 
AACGCTATTA TTTATCTTAA CGAAGCCTTG AGAGCAAGGC CCAATTATTA TAACGCGCTT 
GTAAACAGGG GCATAGCGTT TTATAACGCG GGCGAAGGCA TTAAAGCGTA TAATGATTTC 
CATAAGGCTA TAAACATAAA TAAGGACGGC TGGCTGGCTT ATTATAACAG AGGGTTGTTT 
TATTATGACA TAGGTGACTA TCTTAACGCC GCTTTAGACC AGACCAGGGT TATAAATTTA 
AAACCTTCTT ACGGTAAAGC GTATCTTGAA AGAGGGCGCG CTTTAAAATT AAATAATATG 
TACGCCGACG CTCTTGATGA TTTTAAAATG GCTGTTGAGC TCGCGCCTAA CAACGCCGTT 
GCGCGTTATT ATTTAGCTGA AATGTTTTTT AAAAACCACG ACCTGGGCGG CGCTTTAAGC 
GAACTTTTGA TATCAAAACA ACTTGACCCG AGGTTTGTTC CCACCTACGA ACTTATGGGC 
GATATTTTAG CTTTGGAAGA CAATGTTTCC GCCGCGGCTA ATTATATAAT AGCCAAAAAA 
CTTGATCCCG CCAACGCCAG AAAATATGAC GTGAAAATAA GAAGGCTTCT TTCTGATCAG 
GGCGTACGCA GAACCGTTGA AAGCAGATTC TATTAA

Protein sequence

MKKLFILAVL CLSVFTIGCG SNNANFKKAL YYTDIGRYND ALNLYGKIIK SDPNNYAAYS 
NRAMVHEKIA AAISFKDLKL RQQHLDYAEK DYLKAVKLNP NDAKILNNLG AFYIDRGQYY 
NAIIYLNEAL RARPNYYNAL VNRGIAFYNA GEGIKAYNDF HKAININKDG WLAYYNRGLF 
YYDIGDYLNA ALDQTRVINL KPSYGKAYLE RGRALKLNNM YADALDDFKM AVELAPNNAV 
ARYYLAEMFF KNHDLGGALS ELLISKQLDP RFVPTYELMG DILALEDNVS AAANYIIAKK 
LDPANARKYD VKIRRLLSDQ GVRRTVESRF Y