Gene Huta_1442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1442
Symbol
ID	8383721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	1410989
End bp	1412110
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID	644972505
Product	ATP dependent DNA ligase
Protein accession	YP_003130351
Protein GI	257052518
COG category	[L] Replication, recombination and repair
COG ID	[COG1423] ATP-dependent DNA ligase, homolog of eukaryotic ligase III
TIGRFAM ID	[TIGR01209] RNA ligase, Pab1020 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.114294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGAGG ATCGCGACTG GGCGGCGGTT CTCGGCGTCA GGAGTGCGGA AGTCGATTCG 
GTCCTCGCGG CGTTCGAGGA GAGCGTCTTC GAGGGGCGGC GCTACCGCCA CCTCTCGGCT 
GCCCGCCACG GGATCGAGCG CGGAACGGCG ATCGTCGACG GGACCGTGAT CCGTGGGTTT 
CCGTCGATCC CGCGGACGCT TGTGCTCGAC CCGGGGATCG TCGAGCACTT CGACGGGCGA 
GTGACGATCG AGGAGAAACG CAACGGGTAC AACGTCCGCG TCGCCCGGAT CGACGGCGAC 
GTCCTGGGGT TCACCCGGAG CGGATACGTC TGTCCGTACA CCACCAGCAA AGTCAGGGAG 
CTACTCGACC CCGACTCGTT TTTCGACGCC AATCCCGAGC GCATGCTCTG TGGCGAGTTG 
ATCGGCCCGG AGAACCCCTA CACGCCACAC GAGTATCCCG ACGTCGAGTC CGCGGCTTTC 
GAGGTGTTCG ACGTCCGCGA TCGAGAGACG GGCCGGCCAT TGGCGGTCGA TCACCGGCGG 
GACCTCTGTG CGCGCCACGA CCTGGCGACG GTTCCCGCGT TCGGCGAGTG CGATCCGGTG 
GAGGCGGCCG AGGCCGTCCG GGAGGTGATC GCCGACCTGG ACCGGGCAGG CAAAGAAGGG 
GTCGTGATGC AGTCGATGGA CGGTACCCGG CAGCTGAAGT ACACGACCTC GGCGACGCAT 
CGAGCCGATT TGGAACACGC GTTCTCGCTC CCCTTCGACT ACGGGCGGGA CTTCGTCTTT 
CCGCGGGTTC TCCGGGAGGT GTTCCAGGCC GTCGAGCTGG ATCGAACGAG GGGCGAGTCC 
CGCCAGCGAG CCCAGGAACT CGGGGAGTCG ATCCTCTTGC CCGCGGTCGA AACCGTCAGG 
GCGGTCGAGC GCGGCGAGAC TGTGGGGGAG GAACACACCG TCCGGGACGA CCCTGCCGTG 
ATCGAGGCAC TCCTCTCGCA CTTGCAGGAA ATGGGCATCA AGCTCGAAAT CCAGCAGGAT 
CGAGACGAGA ACGGCGAGCG CGTCGTCTCG TTCGTGAAAG TATCACAGTC GACCCGTGAC 
AACGTCGAAA ACTATCTCGA CGGACAGGTG ATCGACGAGT GA

Protein sequence

MDEDRDWAAV LGVRSAEVDS VLAAFEESVF EGRRYRHLSA ARHGIERGTA IVDGTVIRGF 
PSIPRTLVLD PGIVEHFDGR VTIEEKRNGY NVRVARIDGD VLGFTRSGYV CPYTTSKVRE 
LLDPDSFFDA NPERMLCGEL IGPENPYTPH EYPDVESAAF EVFDVRDRET GRPLAVDHRR 
DLCARHDLAT VPAFGECDPV EAAEAVREVI ADLDRAGKEG VVMQSMDGTR QLKYTTSATH 
RADLEHAFSL PFDYGRDFVF PRVLREVFQA VELDRTRGES RQRAQELGES ILLPAVETVR 
AVERGETVGE EHTVRDDPAV IEALLSHLQE MGIKLEIQQD RDENGERVVS FVKVSQSTRD 
NVENYLDGQV IDE