Gene Hmuk_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2135
Symbol
ID	8411673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2042776
End bp	2044518
Gene Length	1743 bp
Protein Length	580 aa
Translation table	11
GC content	68%
IMG OID	645020476
Product	hypothetical protein
Protein accession	YP_003177955
Protein GI	257388182
COG category
COG ID
TIGRFAM ID	[TIGR02537] archaeal flagellin N-terminal-like domain

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.11758
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCGGG GCCTCGGCCG GCGCGGGCAG TCGTCGCCGA TCGCCGTGAT CCTCCTCGTC 
TCGATGGTCG TCGCCGGCTC GCTGGCCGTC GTGACGCTGG GTGCCCAGTC GCTGTCTGAC 
ACCCGAGAGA CGATGGACGT CGAGCGCGCC GAGAAGGGCC TGACACAACT GGACTCGAAC 
GTCGCGATGG TCGCGCTGGG GAGTGCCGGC GGACAGGAGC TCTCGCTGTC GAGGACGGAC 
GGGGCCGCCT ATCGGCTCCG GGACGACGCG GGGCGGATGA CCGTCGCGGT GACGAACACG 
TCCAACGACT CCACGAAGAC GGTGATGAAC GCGACGCTCG GCTCGATCGC CTACGAGAAC 
GACGGCCGCT CGGTCGCGTA CCAGGGCGGC GGCGTCTGGA AGACGGACGG CGACGGCGGC 
TCGCTGATGG TCTCGCCGCC GGAGTTTCAC TACCGGGACG CGACGCTGAC GCTCCCGCTG 
GTGACCGTCT CCGGCGACGA GTCGCTCGAC GGCCGGATCG CGGTTCGGCC GGGCGGTCGC 
TCGACGCAGC ACTTTCCGAA CGCCTCGGCC GACGAACAGT GGGTGAACCC GCTCGACGGC 
GGCCGCGTCA ACGTGACCGT CAGGAGTGAG TACTACCGGG CGTGGGGCCG ATTCTTCGAA 
GAGCGTACGG ACGGCGAGGC CACGCTCGAT CACGCGAACG AGACGGCGAC GGTGACACTC 
GTCGTCCCGG CCGGGCCACA GACCGTCACG AACGCCGTCG CGGCCACGTC AGCGGGCGGC 
GAGATCGTAC TGGCCGGAAG CGGCGATCAG ACCCGGACCG ACAGCTACAA CTCCTCGAAA 
GGGACCGGGC TGTACGCCGA CACGAAGACG CACAACGGGT CGATCCGGAC GGCCGGCGAC 
GTGACGGTCA AGGGCAACAG CCAGGTCAAC GGCTCGCTGG CGTCGGGAGG CAAGGTGACC 
GTCAAAGGGA GCGGTGTGGT GACCCGAGAC GCCGGTTACA CCGACGACAT CAAGGTCACC 
GGCAGCGGCG GTGTCGACGG CTCGATCGAA CAGCTCTCGG GCGTCGACGG GATCGGTCCG 
ATCGACGCCG TCGTCGATCG ACGGTACGAG AACGCGACCG GGGACAACGA CAACGGCGAC 
ACGAGCGCGA TCACGGGGAC GACGCTGAGC GACGGCGACC AGACGCTCTC GGCCGGCGAG 
TACCACCTCG ATCGGCTCGT TCTCGACGGC GAGACGCTGA CGCTGGACAC CGGGACCGGC 
GGGACGATCA GTCTCGCGGT CCGTGACTAC GTCCAGCTGA AGAACGACGG CCGAATCCAC 
GTCGTCGGAA ACGGGACGGT CCGCCTGTAC GTCGACGGAC AGGCGACGAC GGCGTCGAAC 
CACCACTTCT CGATCGAGGG AAGCGGCGGC CAGATCGACA TCGACGAGGG GCAGAACGCC 
TCCCAGTTCT GGCTCTACGG CCGCGAGGAC TTCCAGGGAC GGATCGACGG GACCTCCAGT 
GACACCCATC TGTTCGAGGG CGTCGTCTTC GCACCCGGCG GCACGCTCGG CAGTAGCTCG 
TTCACGGTCG AGAAAGGGAG CCTCTACGGC GGTGTCGTCA CCGGGAGCGT CACGATGGAC 
AACGGCGGAC AGGTCCACTA CGACCGGTCG CTGAAGCGGG TCAACGCCGT CCCGCCGGCC 
GAGAACATCG TCCGACTGAC CTACCTCCAC GTCTCGGAGA TCGAGATCGA AGCTCGCGAC 
TGA

Protein sequence

MYRGLGRRGQ SSPIAVILLV SMVVAGSLAV VTLGAQSLSD TRETMDVERA EKGLTQLDSN 
VAMVALGSAG GQELSLSRTD GAAYRLRDDA GRMTVAVTNT SNDSTKTVMN ATLGSIAYEN 
DGRSVAYQGG GVWKTDGDGG SLMVSPPEFH YRDATLTLPL VTVSGDESLD GRIAVRPGGR 
STQHFPNASA DEQWVNPLDG GRVNVTVRSE YYRAWGRFFE ERTDGEATLD HANETATVTL 
VVPAGPQTVT NAVAATSAGG EIVLAGSGDQ TRTDSYNSSK GTGLYADTKT HNGSIRTAGD 
VTVKGNSQVN GSLASGGKVT VKGSGVVTRD AGYTDDIKVT GSGGVDGSIE QLSGVDGIGP 
IDAVVDRRYE NATGDNDNGD TSAITGTTLS DGDQTLSAGE YHLDRLVLDG ETLTLDTGTG 
GTISLAVRDY VQLKNDGRIH VVGNGTVRLY VDGQATTASN HHFSIEGSGG QIDIDEGQNA 
SQFWLYGRED FQGRIDGTSS DTHLFEGVVF APGGTLGSSS FTVEKGSLYG GVVTGSVTMD 
NGGQVHYDRS LKRVNAVPPA ENIVRLTYLH VSEIEIEARD