Gene Hhal_1683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1683
Symbol
ID	4709221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1837493
End bp	1838869
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	72%
IMG OID	639856150
Product	exodeoxyribonuclease VII, large subunit
Protein accession	YP_001003249
Protein GI	121998462
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.763853
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCGCA GTAGAGACGA TACCGCCGTC TACACCCCCT CGCAGCTCAA TCAGGAGGTG 
CGGGGCATGC TCGAGACGGT GCTCCCGTCC GTCTGGGTTG AGGGCGAGAT CTCGAACCTC 
GCCCGCCCCT CGTCAGGGCA CATGTATTTC ACCCTCAAGG ACCCCGGCGC CCAGGTCCGC 
TGCGCCCTGT TCCGCGGCCG GGCCTCGGCC CTGCGCCACC GCCCCGCCGA CGGCGATCAG 
GTCCGCATCC GCGCCAAGGC CAGCCTCTAC CCGGCCCGCG GCGAGTTTCA GCTCATCGTC 
GAACACCTGG AACCCTCCGG AGAAGGTGCC CTGCAGCGCG CCTTCGAGGC GCTCAAGCAG 
CGCCTGCAGG CCGAGGGCCT GTTCGATGCT GCGAGCAAGC GCCCGGTGCC GAAGATGCCC 
CGCCGGCTCG GGGTGATCAC CTCGCCGACG GGGGCCGCTA TCCGCGATGT CCTGCAGGTC 
TTGGAGCGGC GCTTCGCGGC GCTGCCGGTG CTGATCTACC CGGTACCGGT CCAGGGCGAA 
GCCGCCGCCC CGGCGATCGT CCGAGCCCTG GAACTCGCCG GGCATCGGGC CGAGGTCGAC 
GCCTTGCTGC TCACCCGCGG TGGCGGTTCG CTGGAGGACC TCTGGCCCTT CAATGAGGAA 
GCGGTCGCGC GGGCCATCCG CGCCTGCCCG ATCCCGGTCG TCAGCGCCGT CGGCCATGAG 
GTGGACCTCA CCATCGCCGA TCTGGCTGCG GATCTGCGGG CGCCCACGCC CTCTGCGGCG 
GCCGAGACCC TGTCGCCCGA CGGCCAGGCC TGGCAGGAGC AGCTCGAGCG CCTCGGCCAC 
CGCCTGGAGG TGGCCGCCGG CAGGCGCCTG GGCCGGGCGG GTGACCAGCT ATCCGGCCTG 
CAGCGCCGGC TGGCCGCCCA GCATCCCGGG CGGCGCCTGC GTGATCGCGC ACAGCGACTT 
GACGAGCTCG AGGGGCGCTT GCACCGGCTC GGCCACCAGG CCGTCGAATC CCGCCGTAGA 
CGCCTTCACA CGGCCGAACA GCGCCTGCAG GTCCAAGACC CTCGCCGACG CACGACCAAC 
GAGCGGCAGC GTGTGGCGGA GCTGGCGCAG CGCCTGCACC ACACCGTCCG CGGCCGGCTG 
GAGACATCGC AACAACGACT GGGCAATGCC TCGCGTGCCC TGCACGCCGT GAGCCCGCTG 
GCCACACTGG AACGCGGCTA CGCCGTGGTA CAGCGGGAGG AGGACAGCGC GATCCTGCGC 
CGGGCCGACG CCGTCCGGGT GGGGGAGCGC ATCCGTGCCC GCCTGGCCCA CGGCGCGCTA 
GACTGTCGGG TTGAGGCACT GCGTAACGCG GAGGAATCGC TGCCCGATGC CGACTGA

Protein sequence

MERSRDDTAV YTPSQLNQEV RGMLETVLPS VWVEGEISNL ARPSSGHMYF TLKDPGAQVR 
CALFRGRASA LRHRPADGDQ VRIRAKASLY PARGEFQLIV EHLEPSGEGA LQRAFEALKQ 
RLQAEGLFDA ASKRPVPKMP RRLGVITSPT GAAIRDVLQV LERRFAALPV LIYPVPVQGE 
AAAPAIVRAL ELAGHRAEVD ALLLTRGGGS LEDLWPFNEE AVARAIRACP IPVVSAVGHE 
VDLTIADLAA DLRAPTPSAA AETLSPDGQA WQEQLERLGH RLEVAAGRRL GRAGDQLSGL 
QRRLAAQHPG RRLRDRAQRL DELEGRLHRL GHQAVESRRR RLHTAEQRLQ VQDPRRRTTN 
ERQRVAELAQ RLHHTVRGRL ETSQQRLGNA SRALHAVSPL ATLERGYAVV QREEDSAILR 
RADAVRVGER IRARLAHGAL DCRVEALRNA EESLPDAD