Gene Huta_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_0140
Symbol
ID	8382402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	136861
End bp	138270
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	62%
IMG OID	644971198
Product	hypothetical protein
Protein accession	YP_003129061
Protein GI	257051228
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGGGG CGGGATTTAC GGCGGTCGGG GGCAGTCTCG CGGGCTGTAC AGACGATTCG 
ACACCGACAG AAGACACTGA GACGGCTGAG ACCACTGATA CCGAATCGAC GACGGAGAGT 
CCCGAGACTG ACGAGCCACC GTCGACGACC GAGAGCGAAA CAACGACGAC GGAAGCGGAC 
GAAACAACTA CCGAAAGCGA TGAGGAGGGT TTGCCGGCGT CAGTGGGCGT CGAGCAAGTC 
GCGGGAGGAT TCACGGCACC TGTAAGCGTC ACGTTTCCAC CAGAGGACGG CGTGGTTCTC 
GTTGCCGATC AGGTGGGAAC GATCCACGTC GTTTCGGACG GGAGCGTCCG GGACGAACCA 
CTGATCGATA TCAGGGATCG GATGATCGAC GTCTCGGGCT ACGACGAGCG AGGGTTGCTC 
GGCTTTGCGC TCCATCCGGA CTATCCCGCG GACGATCGCC TGTTCGTTCG GTACAGTGCG 
CCACCGGGTG AGGCGACACC GGAGGACTAC TCTCATACGT TCGCGCTCTC CTCGTTTTCG 
ATCGAGACGG ACACGCTCGC TGCTGACACT GACACCGAAC AGCGGATACT CGAATTTCCG 
GAACCCCAGA CCAATCACAA CGCAGGCGCA CTCGAATTCG GGCCCGATGG ATATCTCTAC 
ATCGCCGTCG GTGACGGCGG TGGGGCCGAC GACACTGGCA CTGGGCACGT TTCCGATTGG 
TTTGCTGCAA ATTCCGGCGG GAATGGACAG GACGTCACCG AGAATCTTCT GGGCGGTGTG 
CTCCGGATCG ACGTCACCGA AACCGGCGAG GAACCCTATG CGATCCCCGA GGACAATCCG 
CTCGTGGGGA CGGATGGGCT CGACGAGTAT TACGCGTGGG GATTACGCAA CCCCTGGCGG 
ATGGCGTTTC ACGACGGCGA GTTGTACGCG GCGGACGTCG GCCAGGGTCG ATTTGAGGAG 
GTCAACCGCG TCACGAACGG GGGGAACTAC GGCTGGAACG TCCGGGAAGG GACACACTGT 
TTCTCGCCCG GGTCGTCGAA TGGGTCTTGC CCGATCGAGA CACCGGATGG CGAACCCTTG 
CTCGACCCGG TGATCGAGTA TCCTCACAGC GGCCAGCCGG TTAGCGGCGT CGCGGTGATC 
GGGGGACAGT TCTATACGGG CGAGTCGATC CCTGGGCTCC GTGATCGGTA CGTCTTCGCC 
GACTGGCAGG CCAACGGGAC ACTCTTTGTC GGCACCCCAA CGGAGGACGG GCTCTGGGAG 
ACCACGACGA TTTCGGTGGA TGACAGCGAA TTTGCCCCGA TGATCCTGGC GTTCGGCCGC 
GATCAGGCTG GCGAGCTTTA CGTCTGTGCC AGCGAGCGCG GACAGTTGGT CGGCTCGACG 
GGTGCTGTCT ACCGACTGAC ATCGGCGTAA

Protein sequence

MLGAGFTAVG GSLAGCTDDS TPTEDTETAE TTDTESTTES PETDEPPSTT ESETTTTEAD 
ETTTESDEEG LPASVGVEQV AGGFTAPVSV TFPPEDGVVL VADQVGTIHV VSDGSVRDEP 
LIDIRDRMID VSGYDERGLL GFALHPDYPA DDRLFVRYSA PPGEATPEDY SHTFALSSFS 
IETDTLAADT DTEQRILEFP EPQTNHNAGA LEFGPDGYLY IAVGDGGGAD DTGTGHVSDW 
FAANSGGNGQ DVTENLLGGV LRIDVTETGE EPYAIPEDNP LVGTDGLDEY YAWGLRNPWR 
MAFHDGELYA ADVGQGRFEE VNRVTNGGNY GWNVREGTHC FSPGSSNGSC PIETPDGEPL 
LDPVIEYPHS GQPVSGVAVI GGQFYTGESI PGLRDRYVFA DWQANGTLFV GTPTEDGLWE 
TTTISVDDSE FAPMILAFGR DQAGELYVCA SERGQLVGST GAVYRLTSA