Gene Cphamn1_0211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0211
Symbol
ID	6373866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	206045
End bp	207199
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	51%
IMG OID	642682729
Product	integrase family protein
Protein accession	YP_001958665
Protein GI	189499195
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000967186
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGTTT CATCCGTACA CTTGCGGAAG CGGAAGCAGG GGAAGAGCGG GCGCATAAGC 
CTGTATCTTG AGTTTTACAA GGGCGCGGTT ACACAGCCTG ACGGGAAAGC GAAGGTTCTC 
AGGGATTACG AATACCTGAA CCTGTATCTT GACGACAAGC CGAGAACAGC GGCGGAAAAA 
GAGCATAACA AGAATATACT TGAGCTTGCC AAGTCGATCA AGGCAAAGCG GGAACTTGAG 
ATCAAGAACG GGCAGTACGG GTTTGACTCC TGCGTCAAGG CAAAAGCCCT GTTTCTCTCT 
TACTTCAAGG CTGAAGCGGA AAAGAAATCG AAGCCGGGCT ACCCCGGTAA TTGGGGCAGT 
ACTCTCAAGC ACCTCACCAG ATTTGTCGAG AAGCACCGTT CTGTTCGGGT CACCTTCCGG 
GAGATCGACA AGGCGTTTTG CGAAGGGTTC AAGGACTATC TCCGGGATGA GGCGACAACG 
AGAACGGGGA AAGGGCTCTC TTCAGCGTCT CAGGGTGCTT ATTACGGGAA GTTCAAGGCT 
TGCTTGAATA AGGCTATAAA GGACGGAATT CTGTCCGTTG ATCCTGCAAA GGGCGTGGCG 
CGCCCGAAGA TCGTTTCACA CAAGCGGGAA TATCTGACAT TCGACGAACT TCAGGCAATG 
GCTAAGGCTG AGTGCCGGAA CCCTACGCTG AAGCGGATGT TCCTGTTCTC TTGCTTGACC 
GGGTTACGTT TTTCTGATTG TCATAAACTG ATATGGGGTG AAGTGGAACA GTACGGCGAC 
GGGTGGCGGA TCGTATTTCA CCAGCAGAAG ACGAAAGGAC TTCAGTATCA CGACATTTCA 
CAGCAGGCGC GGGAGCTGAT GGGGGAACAG GGCGCGGCTG ATGACCGGGT GTTCTTCGCC 
ATAAGCAAGT ATTCGGCGTA TCTCAGTATC GTTCTCCGGG AATGGGTTTT GAAGGCAGGC 
ATAACAAAAC ACCTGACGTT TCATTCAGGC CGTCACACCT TCGCAGTGTT ACAACTGGAG 
AATGGGACAG ACATTTACAC ACTCAGCAAG CTATTGGGAC ATAGAGAGAT CGAGGTAACG 
GCTATTTATG CCGATATTCT GGATAAGAAG CGGCGTGAGG CGATGACTGA GCGGATTCCT 
GAACTGAGTT TATGA

Protein sequence

MDVSSVHLRK RKQGKSGRIS LYLEFYKGAV TQPDGKAKVL RDYEYLNLYL DDKPRTAAEK 
EHNKNILELA KSIKAKRELE IKNGQYGFDS CVKAKALFLS YFKAEAEKKS KPGYPGNWGS 
TLKHLTRFVE KHRSVRVTFR EIDKAFCEGF KDYLRDEATT RTGKGLSSAS QGAYYGKFKA 
CLNKAIKDGI LSVDPAKGVA RPKIVSHKRE YLTFDELQAM AKAECRNPTL KRMFLFSCLT 
GLRFSDCHKL IWGEVEQYGD GWRIVFHQQK TKGLQYHDIS QQARELMGEQ GAADDRVFFA 
ISKYSAYLSI VLREWVLKAG ITKHLTFHSG RHTFAVLQLE NGTDIYTLSK LLGHREIEVT 
AIYADILDKK RREAMTERIP ELSL