Gene Haur_0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0810
Symbol
ID	5732710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	917439
End bp	919460
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	52%
IMG OID	641277941
Product	DNA ligase, NAD-dependent
Protein accession	YP_001543586
Protein GI	159897339
COG category	[L] Replication, recombination and repair
COG ID	[COG0272] NAD-dependent DNA ligase (contains BRCT domain type II)
TIGRFAM ID	[TIGR00575] DNA ligase, NAD-dependent

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTGT CAGAGCAGAC GGTTGCCCGC GCCGCAAGCT TGCGCGATGA ATTGAATCTA 
TACAATCATC ATTATTATAC GCTTGATGCA CCGCTGGTCA GCGATGCTCA ATACGATAGT 
TTATTAAATG AATTGCGGGC GATTGAGGCC GAATATCCCG AATTACGCAC CCCCGATTCG 
CCGACCCAAC GGGTTGGTAG TGCTCCGTTG AGCAAATTTC CCAAAGTGCA GCACCCTGTG 
CCAATGTTGA GCCTTGGCAA TGCCTTTAAT GCCGATGATT TGGCCGCGTG GCGACGACGC 
GCTGAACAAA TTATTGGTAC GCAGCCGATG AGCTATACCG TTGAGCCAAA AATTGATGGC 
TTGGCCGTGG CATTAACCTA TATTAATGGG GTATTTAGCG TTGGCGCAAC CCGTGGCAAC 
GGCGAAATTG GCGAGGATAT TACCGCCAAC CTACGCACAA TTCGCGATGT GCCCTTGCGG 
CTGCAACCAA TCGACGGCCA AGCCTTGCCC GAACGCATCG AAGTGCGTGG CGAGGTCTAT 
TTGCCTATCG AATCGTTTAA TCAATTGAAT GAACGCCAAG CCCATGCTGG CGAAAAAGTC 
TTTGCCAATC CACGCAATGC TGCCGCTGGA TCGTTGCGTC AGCTCGATTC AACGATTACT 
GCTAGCCGTC CGTTGCGCTT TTTTGCCTAC GCTGTCGGCC CTTTCAGCGG CGTTGAACTC 
AAAAGCCAAG CCCAAACCCT TGATACCTTG CGCACTTATG GGTTTAGCGT TAATCCCGAT 
ACGCGGCTTT TTGCTGATTT TGAGGCGGTA ATCGAATATT GCCACGAGTG GATGAGCCGC 
CGTGAATCGC TAAGCTACGA AGTTGATGGC GTGGTAGTTA AAATTAATGA TTTTGCCATG 
CAACGTGAAT TGGGCGTGGT TGGTCGTGAT CCACGCTGGG CGATTGCCTA TAAATTTCCA 
GCTCGCGAAG AAACCACCAC CTTGCTCAAT ATTGTGATCA ATGTTGGTCG CACTGGTAAA 
TTGATTCCCA ATGCTGTGCT CGAACCTGTC AGTTTGGGCG GCACGACGGT GCAGCATGCC 
TCGTTGCACA ACGCCGATTA CATCATCAGC CGCGATATTC GCATTGGCGA TCGGGTTGTG 
GTCAAACGGG CTGGCGATGT GATTCCCTAT GTGATTGGGC CAATCGTTGA GGCTCGCACT 
GGCGACGAGC GAGTTTGGCC AGCGCCAACT CATTGTCCAA CTTGTGGTCA GCCAGTCGAG 
CAAATTGGCG ATGAAGTTGA TATTTATTGC GTCAATAATA CTTGTCCTGC GCGTTTGATT 
CGTTCAATCG AACATTGGGT CAGCCGTGGC GCGATGGATA TTGTGGGCAT GGGCGAGCGC 
CAAGCCAGCC AATTTGTCGA AATGGGCTTG ATCAAATCGA TTCCTGATAT TTATCGTTTG 
ACGGTTGATA GCTTTGGGGG GCGTGAAGGC TATGGCGAAC GGCGCGTCGC TAATTTGCTG 
AATGCGATCG AAGAATCCAA GCGACGCCCG CTTGATCGTG TCATCACCGC TTTGGGGATT 
AACGGAGTTG GAACGGTGGC GGCGGCGGAT TTAGCCCGCT ATTTCCGTTC ATTGCCAGCC 
TTAGCCCAAG CCACGATTGA GCAATTGACC GCGATTGAGG GGATTGGTGG CAGCACCGCC 
CAAAGCGTGG TCGATTTCTT CAATACGCCA GCCAACCAAC AATTAATCGC CGAATTATTG 
GCTTTAGGCC TCAAAGCCGA GCCTAGCGAA GTTGCTGAAT TGCAGAGTGA TCGTTTGGCG 
GGCAAAAGTT TTGTGATCAC TGGAACCTTG CCTGGCATTA GCCGCGAAGC CGCTCAAGCC 
TTGATCGAAG CCCATGGCGG CAAGGTTGGC GGTAGCGTCA GCAAGAAAAC TGATTATTTG 
CTGGCAGGCG AGGCAGCTGG CTCGAAATTG ACCAAAGCCC AAAGTTTAGG CGTAAAAGTG 
CTGAGCATGG ATGAGTTGCA TGCGCTACTG GTCGATGAAT AG

Protein sequence

MAVSEQTVAR AASLRDELNL YNHHYYTLDA PLVSDAQYDS LLNELRAIEA EYPELRTPDS 
PTQRVGSAPL SKFPKVQHPV PMLSLGNAFN ADDLAAWRRR AEQIIGTQPM SYTVEPKIDG 
LAVALTYING VFSVGATRGN GEIGEDITAN LRTIRDVPLR LQPIDGQALP ERIEVRGEVY 
LPIESFNQLN ERQAHAGEKV FANPRNAAAG SLRQLDSTIT ASRPLRFFAY AVGPFSGVEL 
KSQAQTLDTL RTYGFSVNPD TRLFADFEAV IEYCHEWMSR RESLSYEVDG VVVKINDFAM 
QRELGVVGRD PRWAIAYKFP AREETTTLLN IVINVGRTGK LIPNAVLEPV SLGGTTVQHA 
SLHNADYIIS RDIRIGDRVV VKRAGDVIPY VIGPIVEART GDERVWPAPT HCPTCGQPVE 
QIGDEVDIYC VNNTCPARLI RSIEHWVSRG AMDIVGMGER QASQFVEMGL IKSIPDIYRL 
TVDSFGGREG YGERRVANLL NAIEESKRRP LDRVITALGI NGVGTVAAAD LARYFRSLPA 
LAQATIEQLT AIEGIGGSTA QSVVDFFNTP ANQQLIAELL ALGLKAEPSE VAELQSDRLA 
GKSFVITGTL PGISREAAQA LIEAHGGKVG GSVSKKTDYL LAGEAAGSKL TKAQSLGVKV 
LSMDELHALL VDE