Gene Haur_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1107
Symbol
ID	5732998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1267546
End bp	1268670
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	52%
IMG OID	641278245
Product	radical SAM domain-containing protein
Protein accession	YP_001543883
Protein GI	159897636
COG category	[L] Replication, recombination and repair
COG ID	[COG1533] DNA repair photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.614864
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTATT ATGTTGAAGA GCGCCCAGGT GGGCCAGCGC TAGCACCTCG TCGCCCCACA 
ATTAATGAAT TTTTTCTCTC GACCTATCAA GTTGGTCCAT ATGTGGGCTG CGAGTTTGGG 
TGTGCCTATT GCGATGGCTG GTCGTTCAGT CAGCGGCCAT TTAACGAGGT TATCCGCGCT 
AATGTTGATT TGCCTGATCG CTTTGCCGAG CAACTGAGCG TGGTTTCACG CGGCGATCTA 
ATTGCCTTCA GCCTTGGCGA TGCCTACCAA CCTGCCGAAA AAACCTATCG CCTCACCCGC 
CAGATGCTCC AGGCTTGCCA AGTTGCCAAG CAACCAGTGT TAATTTTGAC CAAAAGCTTG 
GCAGTGATGG ATGATTTGAG CTTGCTGCAA CGCATGAATG AGCAGGGCTT GGCGATTGTG 
GTGATGAGCA TTCCGACGAT TGATCCCTTG CTCTCGGAAA AATTAGAGGG CAAAGTTGCC 
CCCCCCTCAG CTCGTTTGGA AGCCTTGAAT ACCCTCAAAC GTGCAGGCAT TCCAACTGGC 
GTGGCGATGT TGCCAGTTAT TCCGTATCTG ACCGACACTG ATCGCCAATT GCCTTTGACC 
TTGAATGCGA TCGCCAATGT TCAGCCCGAT TTTGTGGTTT GGGAATATCT ATGGCAGCCG 
AATGAACGCC ATCGCCAACG AATTACCGAT TTGCTTTCGC GCTTGGGCAA TTATCCCGCC 
TCATATTATC GTGAATTGTA TGGCAAGGAT ATGCAGCCGA GCCTCGAATA TCGCCGTGAG 
ATGCATCGCG ATATTTTGGG GCGTTTTGAA GAGCTGAATC TTAACCCGCG AGCACCACTG 
GAGTTGTATC GCGAGCATTT GGCTCCCAAT AATGTGGCGG CATTGATGCT CAAACATCAA 
GCCTTTATCG ACCAAATCAA GGGTCGCGAA CTATTGGCCA GCCGCCACTC GAATTTGGCC 
GAAGCGGTGT TCAATGGCAA AGCCGATGAG CCAGCCTTGG CGGTTAGCCC ATTGTGGCCG 
ATGTTGCGCG AAGTGCTGAA TATTAGTGAT ACCCGCGCCC GACTCGACCA AATTCTTGAA 
AAAGTGCGTA ACCCTGATAC CCCTAACGAT CCCAGTAGCG AGTGA

Protein sequence

MAYYVEERPG GPALAPRRPT INEFFLSTYQ VGPYVGCEFG CAYCDGWSFS QRPFNEVIRA 
NVDLPDRFAE QLSVVSRGDL IAFSLGDAYQ PAEKTYRLTR QMLQACQVAK QPVLILTKSL 
AVMDDLSLLQ RMNEQGLAIV VMSIPTIDPL LSEKLEGKVA PPSARLEALN TLKRAGIPTG 
VAMLPVIPYL TDTDRQLPLT LNAIANVQPD FVVWEYLWQP NERHRQRITD LLSRLGNYPA 
SYYRELYGKD MQPSLEYRRE MHRDILGRFE ELNLNPRAPL ELYREHLAPN NVAALMLKHQ 
AFIDQIKGRE LLASRHSNLA EAVFNGKADE PALAVSPLWP MLREVLNISD TRARLDQILE 
KVRNPDTPND PSSE