Gene Dret_2203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2203
Symbol
ID	8420059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2505665
End bp	2506642
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	57%
IMG OID	645038802
Product	type IV pilus assembly protein PilM
Protein accession	YP_003199065
Protein GI	258406323
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4972] Tfp pilus assembly protein, ATPase PilM
TIGRFAM ID	[TIGR01175] type IV pilus assembly protein PilM

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCCCG GTAAGGCCGG CCCGCAGCTG GAACGACTCG GCCGGGTACC CTGGCCGCGA 
CAGGACAACG AGGCCACGGA CGCCAAGGCC GAACGCCTCC GCCAATTGTG GCAGGCGCTG 
GAACTCAAAG ACAAAGTCGT CACTTCCTCA ATGGCCGGAC ACGCCGTGAT TGTGAAGCGC 
GTGCGCTTCG CCAAGGACAG GATCCGACAC CTCGCCGCCG AAGTCCAGAA AGAGGCGAAG 
CAATACATCC CCTTCGATAT CAACGACGTC TACCTCGACT TCCAGGATCT GGGACCTGAA 
TCGGAACAGG CGGGGTTCCA TCAGGTTTTG CTGGTGGCCA GCAAGAAAAA GATGGTCCAC 
GAGGTCCAAA ATGTGCTCTC GGCAGCCGGG CTGGGATTGT CGGTTCTGGA TGTCGATGCC 
TTTGCGCTGA CCAATTGTTT TACCTTCAAT TATCCTGAGT GGAGCGACAA ACCGACCTAT 
CTGCTCGATA TCGGCGCCCA GCAGTCCGTC TTTTGCGTTT GTGCTCAAGG GCGTCCTCTG 
TTTTTACGCG AAATCGCATT TGGCGGACAT CAGATCACCG AACGGTTGGC GCGGACGTTG 
GAGATTACCA AAACCGAGGC TGAAAAACTC AAAGTCAACG GTCCCAAGGA GGAGGACGCG 
AGCAATATCG CCACCGTCCA GGATGTCTTG AATAAGGTGT TTGCCGATTG GGCCCAGGAA 
ATCCAGCGCA TGCTCACTTT TTACCAATCC TCGGAAAGCG GCGGATTGAC GTCGACGCGG 
ATGCTCCTAT CCGGCGGCGG AAGTCTTATT TCCGGTTTAC CTGAGCGGTT TGCCGAACGA 
TTGGAGATGG AGGTCGGGCT TCTCGATCCT TTCCGGCGGA TCAATATCTC GCCGAATCTT 
TTCGATCGAA ATTATCTGAC TCGCACCGGG CCGCAGTTTG CGGTGGGCAC GGGGCTTGCC 
CTGCGACAAG CCGTATAG

Protein sequence

MVPGKAGPQL ERLGRVPWPR QDNEATDAKA ERLRQLWQAL ELKDKVVTSS MAGHAVIVKR 
VRFAKDRIRH LAAEVQKEAK QYIPFDINDV YLDFQDLGPE SEQAGFHQVL LVASKKKMVH 
EVQNVLSAAG LGLSVLDVDA FALTNCFTFN YPEWSDKPTY LLDIGAQQSV FCVCAQGRPL 
FLREIAFGGH QITERLARTL EITKTEAEKL KVNGPKEEDA SNIATVQDVL NKVFADWAQE 
IQRMLTFYQS SESGGLTSTR MLLSGGGSLI SGLPERFAER LEMEVGLLDP FRRINISPNL 
FDRNYLTRTG PQFAVGTGLA LRQAV