Gene Haur_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1565
Symbol
ID	5733452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1816208
End bp	1817338
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	51%
IMG OID	641278704
Product	integrase family protein
Protein accession	YP_001544336
Protein GI	159898089
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0206581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAGT TAGAGTTAAT TCCACATGTG AGCAACAATC CACTTGCGCC CGATTTTACG 
ACGGTGATGA AGCAACGCAG CGCCGTGGCT GATCAGATTT CGGCCCAACA TAGCTTTATC 
GAATATCGCT TGCGTCAACG CCCCCAAACG ATTCGCCGCC ATAACACCGA TTTGAAAATT 
TTTGCCGATT TTTTGGCCTC AATTGGCATT GTGATTCCGG TTGATGAACA AGAAGTGCCA 
ATTCTGGCCA CTGAGCCAAA TGCTTGGGCC GAGATGAGCG TCGGCATCGT CACGACGTTT 
CGCACTTGGA TGTTGAATGA AGGCTATGCG CTTGGCTCAA TTAATATTCG GCTTGGCACG 
GTGCGCTTGT ATTGTCGCTT GGCACATCAA GCTGGCGTGT TGAGCCTTGA GGCATGGAGC 
CGAATTCACA CGGTTGAAGG CTATCGCCGC CGCGAAGGCG ATGGCATCGA TGCCCAACGT 
GAAGCGACCG AAACGCCCAC CCGCCTCTCG ACCAAAAAAG CCGCACCGCA TATTTTGGAT 
CAAAGCCAAA TTCGCGAGCT TAAACGGGCC GCCCGCAATA ATCCGATCAA CCGAACACCT 
GAGGTTGGTT GGCGCGATTA CCTGATCGTC TGTTTGTTGG TTGATTTGGG CATGCGTTGT 
GGCGAGGTGG TGGTGCTCAA GTGGGAGCAT ATCCAAGGCA AAATTTTGCT AGTAGATCGC 
CCAAAAGTTG ATAAAGTGCA AAAACATCGC TTGATTGGCG ATACAGCCAA GGCCTTGCGT 
GAATACCAAA AAGTTATTGC CCAACCGCTT GAGCTTAAAA CACCGTTGTT GGCAGCCTTT 
GATCACAAGG GCAATCATGT TGGCTTTGGT ATTTCCGAGC GGGCAATTCA CAAACGGATT 
GTGCAGCTTG GCAAATTAAT TGGCATCAAC AATCTTGCGC CGCATGATTT GCGCCATTCG 
TGGGCCACCC GCGTTGCCCA AACCAATATT CCGGTGCAAG CCCTGCGCGA TGCTGGCGGC 
TGGACCAACC TCAACACCCC CAATCGCTAC ATTGCCCAAC AAGCGGTTGC CAATGATGGT 
GTAACGCTGC ACAGCGATGA TCGGCTGCTT GAGGATGATG ACGAAGCCTA A

Protein sequence

MDELELIPHV SNNPLAPDFT TVMKQRSAVA DQISAQHSFI EYRLRQRPQT IRRHNTDLKI 
FADFLASIGI VIPVDEQEVP ILATEPNAWA EMSVGIVTTF RTWMLNEGYA LGSINIRLGT 
VRLYCRLAHQ AGVLSLEAWS RIHTVEGYRR REGDGIDAQR EATETPTRLS TKKAAPHILD 
QSQIRELKRA ARNNPINRTP EVGWRDYLIV CLLVDLGMRC GEVVVLKWEH IQGKILLVDR 
PKVDKVQKHR LIGDTAKALR EYQKVIAQPL ELKTPLLAAF DHKGNHVGFG ISERAIHKRI 
VQLGKLIGIN NLAPHDLRHS WATRVAQTNI PVQALRDAGG WTNLNTPNRY IAQQAVANDG 
VTLHSDDRLL EDDDEA