Gene Huta_1703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1703
Symbol
ID	8383989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	1696248
End bp	1697513
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	49%
IMG OID	644972770
Product	McrBC 5-methylcytosine restriction system component-like protein
Protein accession	YP_003130609
Protein GI	257052776
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCTCT CTTTCAATCG TAACCAGGAG GAGTTTGAAG CCGACATCCA GTTGGGAGAA 
TACGAATCCA GCGAACCAAT TGAACTCTCA GAGATGGCCG TATCGATGCT GGAAAACGAA 
GTGAATAGCG GAGAGGAAAA AGAGGGCGAC CGTATCAAGT TGCATTACAA CCGAGATGGG 
GAAGCAATAC TCACTTCGAC CCAGTACGTT GGAGTCGTTT CGTTGAGAGA TGGACCCACT 
ATTGAAGTCC GCCCGAAAGC GGCCGGCACA AACCTCCTGT ATCTTCTCCA ATACGCTCAT 
GACACGACTG CGACCACGTT CGAATCACAG GCTCCGTATC AAGCAGGTCA CACTTTTCTC 
GATGCATTTG GTGCACTCTA CGAAGCGGAA TTGCGGAGAA TTGTAGATCG AGGACTCTAC 
ACGGACTACC GAAGAACCGA CGCTACCGAG TCTCATCTTC GCGGACGACT CGATATCCAT 
CGCCAGCTAC AGCGACAACC ACCAGTTCCT ACTGCGTTTG AATGTACTTA CGACGAATTG 
ACTCATGATA TTCTGGCGAA TCGAGCCATC CTACATGCTA CCACTGTCTT GCTAGGGGCG 
GTCTCAGACC GTTCAATAAC CCAGTCGCTT CGTCAACATC AACAGTTGCT TCGCCGTCAG 
GTTTCCCTTA CGCCTGTGAC GATACAGGAC ATAGAGCGTA TTGAACTCAA TCGTCTTGCT 
GACCACTACG AGGACATTCT CCGACTTACT AAATTGGTGA TTAGGAACTC ATTCGTGTCG 
GAACTCCAAG CCGGCTCGAG TGCGGCGTTT GCGATGTTAG TAAATATGAA TACGATATTC 
GAGAACGCAG TTGAGCGTGC CTGTAAAGAA GTTCTGTCAG AGCGCGAAGA TTGGGAAGTG 
AAATTCCAGG ATACGTCACA GAACTTAATC ACTGGCGGAA AACACACAGT GACACTTCAG 
CCCGATATTA CGATATATGA CCCGGAAAAT ACGGTATCAC TCGTTGCTGA TGCGAAATGG 
AAGAATGAGA GGCCGAAAAA CGCCGACTTT TACCAGATGA CGTCATACAT GCTCGCCAAC 
AACGTACCGG GAATACTATT TTACCCCGAT TGTGGTGGAC TCAATGAGTC ACGTTCGACT 
GTCACTGGTG GATTCCCCCT TTGGCTATCT GAACTACCTA CTGCTGTCCA AGTGAATTCC 
TACGAAGATT TCGTCTCAGC TTTTGAGTCC GAAACGGCGG ATGCAATTTT TGGAATGGTG 
GATTAG

Protein sequence

MSLSFNRNQE EFEADIQLGE YESSEPIELS EMAVSMLENE VNSGEEKEGD RIKLHYNRDG 
EAILTSTQYV GVVSLRDGPT IEVRPKAAGT NLLYLLQYAH DTTATTFESQ APYQAGHTFL 
DAFGALYEAE LRRIVDRGLY TDYRRTDATE SHLRGRLDIH RQLQRQPPVP TAFECTYDEL 
THDILANRAI LHATTVLLGA VSDRSITQSL RQHQQLLRRQ VSLTPVTIQD IERIELNRLA 
DHYEDILRLT KLVIRNSFVS ELQAGSSAAF AMLVNMNTIF ENAVERACKE VLSEREDWEV 
KFQDTSQNLI TGGKHTVTLQ PDITIYDPEN TVSLVADAKW KNERPKNADF YQMTSYMLAN 
NVPGILFYPD CGGLNESRST VTGGFPLWLS ELPTAVQVNS YEDFVSAFES ETADAIFGMV 
D