Gene Cpha266_2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2069
Symbol
ID	4569502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2402627
End bp	2403886
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	51%
IMG OID	639766650
Product	phage integrase family protein
Protein accession	YP_912505
Protein GI	119357861
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0530977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTCCG GAGAGGTTGC CTTCTACATT GATACTTATC ACAAGGATTA CGGGCGGTTC 
TCGCAGAAAA CCGGGTTACA GGTGAATCCG AAAAACAGGA AGGAGCATAG GGATGTTCTG 
GCTGAGGCTC AGGATAAGGC TCGCCAGATT GAAAAGGATT TGGTTCGTAA TCCTGCCGGA 
GTGTTTGATC GAAAGGTTAA GGCGGCAGAT GACTTCATCG AGTTCTACCG TCGATATGCC 
GAAAAAGACA ATTATCCGAA GTATGCCAAT GTTCTTCCTA TCCTCCGGCG GTTTTCATTG 
GGCGTGATTC ATTTCGCGTC CTTGAATAGT GCTTGGCTTG AGCGGTTCAA ATTCTATCTG 
CTTTCCCTTG AGTCCATAAG TCAGAACACG GCGGGCGGGT ACCTTACTTC GGTAAAGACG 
GTTCTCAGGC AAGCTTTCCG GGAAGGCTAT CTCATCGAAG ATATTTCCGC AAAGGTTCCC 
GGTATCAAGA AAACAGACAT TCAGCGACAC TTTCTTCCGG TTGAACAGGT CGAGGCATTG 
CACAAGGCAA AGAGCAATAA TGAGATGATC AAGCAAGCCT TCCTTTTCGC CTGCTTTTCC 
GGTTTGAGGC TCTCGGATGT TCAGGCCTTA TACTGGGAAC AGATCAGCCA GATCAATGGC 
GCTCCATATA TCCAGTTTCG ACAGAGAAAA ACCTGCCAGT ACGAAAATCT GCCGCTTTCC 
GAGCAGGCTG CTACGATTCT TCAGGAAGTG AGGGCGTTAC ATGCCGAATA TGCTCCTTCC 
GGTAGTGATA AGGTTTTTAT TCTGCCGAGC CGTGAACGGA TAGCTCAGGT TCTGGAAGTC 
TGGGGTATTC GTGCGGGGCT GCCGTTCAAA CTCCATTTTC ATGTTTCCCG TCATACCTTT 
GCAACCATGA ACCTTACTGC CGGGTGCGAC CTCTATACCG TATCAAAGCT TCTGGGGCAC 
AGGGAGATTA AGACTACTCA AATATATGGC AGGATTGTTG ACAGCAAGAA ACTTGATGCG 
GTACAGGCAT TACCGGTTCT TCAGGGAGCT ATCGGAAACG GGGCGGCTAC TGCGGGGATT 
CAACAGACCG GGTTGCTTCC CTCCGTCGGG AAGAGTCCTG TTGTGCAGGC GCTTGAGGCA 
GAGGGGGAAA GGGTCGCCAG AGCGTTGAAG CTCCAGCGGA ACGGTTCAGG GCGGTATGAG 
TTCGGGGGCC GTGAGTACAC AGCAGCAGAG TTGGCAATTG AGGTTTCGGG CGGCGATTAA

Protein sequence

MASGEVAFYI DTYHKDYGRF SQKTGLQVNP KNRKEHRDVL AEAQDKARQI EKDLVRNPAG 
VFDRKVKAAD DFIEFYRRYA EKDNYPKYAN VLPILRRFSL GVIHFASLNS AWLERFKFYL 
LSLESISQNT AGGYLTSVKT VLRQAFREGY LIEDISAKVP GIKKTDIQRH FLPVEQVEAL 
HKAKSNNEMI KQAFLFACFS GLRLSDVQAL YWEQISQING APYIQFRQRK TCQYENLPLS 
EQAATILQEV RALHAEYAPS GSDKVFILPS RERIAQVLEV WGIRAGLPFK LHFHVSRHTF 
ATMNLTAGCD LYTVSKLLGH REIKTTQIYG RIVDSKKLDA VQALPVLQGA IGNGAATAGI 
QQTGLLPSVG KSPVVQALEA EGERVARALK LQRNGSGRYE FGGREYTAAE LAIEVSGGD