Gene Haur_3320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3320
Symbol
ID	5735190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4184330
End bp	4186093
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	52%
IMG OID	641280467
Product	DNA repair protein RecN
Protein accession	YP_001546084
Protein GI	159899837
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCTAG AATTATTTAT TGCCGATTTC GCAATTATTG ACCAAGTACG CCTGCACTTT 
ACCCCTGCCT TTAATGTGCT GACGGGTGAA ACCGGAGCCG GTAAGTCAAT TATGATTGAT 
GCACTCGGCA TGTTACGGGG CGAGCGGAGC GATCCCAGCT TTGTGCGAGC GGGAAGCAAT 
CAAGCCCGGG TTGAAGGTAT CTTCACCTTG GCTGATCGCC CTGATATTCT GCCTATTTTA 
GCCGAATATG GCCTTGATGG TGCTGATGAT GATCAGATTA TTCTGACCCG TGAAATTCAT 
GGAGCCAGCG GGCGTAGCGT TGCTCGAATT AATGGCCGCG CCGTGAGTAG TGCTGTGCTC 
CGTGATATTG GCGGGCGCTT GGTCGATATC CACGGCCAAA ACGATAGCCA AACCTTGTTC 
AATGTACGCA CCCACGCCGA AATGCTCGAT CGCTATGCTG GAGTTGTCGC TGATCGCGAA 
CAACTGAGTC AGCAGGTGAT CGCGATTGAA GCCGTGCGCA GCCAAATTAG CACCTTGCGC 
AATGCCGAAG CGCGTCGCCT CGAACGGATC GAAGAATTGA CCTTTTTGGT TGAGGAATTG 
ACCAACGCCA AGTTGATCGC TGGCGAAGAG GCTACGTTAA CCAACGAACG CGGTTTATTA 
CAAAATAGTG CTAAAATCAC GGGCACGGTT GATACGATCT ATCGTTTGTT GCGCACTGGC 
ACGCCAGCCA GCGAACGGCG TTCAGCCACC CGTTCAATTG TCGATAGCCT TGATGATGTG 
GCTAATTTGT TGAGCGAATT GTTGCGGCTA GACCCAAGTT TGGCTGGATT GAACGAGCAA 
ACCCTTGAAG TGCGCTATCG ACTTGACGAT GTGATCGAAG GCGTGCGGGT CTATCGCGAT 
CGGCTGGAGT TTGAGCCAGG CCGTCTCGAA GTGATCGAAG ATCGTTTAGC TGAGTTGCGC 
GATTTAGCCA AAAAATACCG TGCTGCCGAT GCTGCCGAAT TGCTCGAACG CTTGACCAGT 
GCCAGCGATG AACTGGAAAC CTTGCACTAC AGCGCTGAAC ATATTGCCGA ATTGGTGCAA 
CAAGAACAGC AATTGTTGGC AAGCATTGGG CTAGCTGCCG CTGAACTGAG CCGCCGTCGT 
CGCCAAGCAG GCGATGAATT GGCTGGGCGG ATTGCCGCTG CCATGAGCGA TTTAGCCATG 
CCGCATGTTA AATTTCATGT GCAAGTATCG CAGCGCAGCG ACCCACAAGG CGTATTGATC 
GATGATCACT ATCTCGCCTT TGATCGCACG GGAGTTGATC AGATTGAGTT TTTACTCAGC 
CCCAACCCTG GCGAGCCACT CAAACCGCTG GCCAAAATTG CCTCTGGTGG TGAATCGGCA 
CGCTTGCTCT TGGCGATGAA ATCAATTCTT TCAGCAGTTG ATAGTGTGCC AACCTTGGTT 
TTTGATGAAG TTGATGTGGG AGTTGGGGGA CGGGCTGGCC ATGTGGTCGG CGAAAAATTA 
TGGGGCATTA GCGATGCCCA TCAAGTGTTG TGTATTACCC ACTTGCCTCA AGTTGCCGCT 
TTTGGTGATT GCCATTTTGC GATTGCCAAG CAAGTTATTA ACCAACGCAC CCAAACCTTT 
GTGCAACCAC TCAGCGAACA AGAACGCATC GAAGAACTAG CGGCGATGCT TGATGGAACA 
CCAGTGAGCG AAGCGAGCCG TCGCTCGGCC AGCGCCATGC TCGAACGGGC TGCCAACTAC 
AAACTGGCAA CCAGCAACCC ATAA

Protein sequence

MLLELFIADF AIIDQVRLHF TPAFNVLTGE TGAGKSIMID ALGMLRGERS DPSFVRAGSN 
QARVEGIFTL ADRPDILPIL AEYGLDGADD DQIILTREIH GASGRSVARI NGRAVSSAVL 
RDIGGRLVDI HGQNDSQTLF NVRTHAEMLD RYAGVVADRE QLSQQVIAIE AVRSQISTLR 
NAEARRLERI EELTFLVEEL TNAKLIAGEE ATLTNERGLL QNSAKITGTV DTIYRLLRTG 
TPASERRSAT RSIVDSLDDV ANLLSELLRL DPSLAGLNEQ TLEVRYRLDD VIEGVRVYRD 
RLEFEPGRLE VIEDRLAELR DLAKKYRAAD AAELLERLTS ASDELETLHY SAEHIAELVQ 
QEQQLLASIG LAAAELSRRR RQAGDELAGR IAAAMSDLAM PHVKFHVQVS QRSDPQGVLI 
DDHYLAFDRT GVDQIEFLLS PNPGEPLKPL AKIASGGESA RLLLAMKSIL SAVDSVPTLV 
FDEVDVGVGG RAGHVVGEKL WGISDAHQVL CITHLPQVAA FGDCHFAIAK QVINQRTQTF 
VQPLSEQERI EELAAMLDGT PVSEASRRSA SAMLERAANY KLATSNP