Gene PCC8801_4550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4550
Symbol
ID	7095929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011723
Strand	+
Start bp	36115
End bp	37203
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	51%
IMG OID	643467530
Product	integrase family protein
Protein accession	YP_002364826
Protein GI	218203973
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	85
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.798479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACCA ATGCCACCCC TTCCCCTCTC AGTGAGGCTG ACTTATTAGC TCGCTTTGCC 
CAGTTTGTCC GTCTCGATAC CGCCGATGGC AATGCTTCTG ACGATACGGT GAAAACCTAC 
GCCTGTACGG TTAAGCAATT TCTCGGTTGG TGCGACGCGC AACGGCTTCA TCCTCTCGAT 
GCGACGCGAG ATGACCTCAA ATCCTATCGG CGTTGGTTAG TGGACGGTCA ACAATACAAA 
TGTGCCACCA TCGCCTTGAA ATTGACGGTG GTGCGTCGTT TTTATGCAGG GGCGGTGGAA 
CGGGGGCTGA TTCTGGCTAA TCCGGCTTTG GGCATTAAAC CCCCCAGGGA AACCATCGAT 
CCGGCTGAGC GCATTAATTA CCTCGAAGAA GCCGAAGTAA CGCGGTTATT GGAGAGTTTG 
CCCACTGAGA ATACGGTGGG GGCGTTGCGG GATAGGTTTC TGGTGGCCGT CATGGTTTTG 
GAGGGATGCA GAACCGTGGA AATGCACCGC GCTTCTATTG GGGATATTGT AAAACGAGGT 
GGTGATATCG GCATTCGGGT ATCAGGAAAA CGATCTCGAC GCATTGTGCC GTTAACGCCT 
GATTTAGCCA AGCTGCTGAA TAAGTATCTG AATGCTAGGA AGCGGTCAGG GGAGGCATTG 
TTAGCGGATA CTCCTTTGTT TATTGCGTTA GATAAAAGGA CGTATGGAGG GCGATTAAGT 
CGTCGTTCGA TTCAGCGAGT AATTGATAAG TATTTACAGG CATCAGGGTT GAAAGAGCAG 
CCGACAAAAC AAAAAAGCCC AAAACGGGCA TCTAATCAGT CTCATCAACC GTCTAGCGGG 
GAGAAACAAC GCTCTTCACA ATCTGCTTCA TCTACGTCTA CTAAGTTTCA ACAACCAGAG 
CGACAGTTGA GCGCACATTC TTTGAGGCAT ACGGCAGGGA CATTGGCCAT CAGGGCAGGT 
TCGGATTTAA GGCAGGTGCA GGATTTGTTA GGCCATGCTG ATCCCAGGAC GACTGCTTTG 
TATGCTCATG TGGCTGATCG GTGGCGCAAT AATCCAGCCT TGAGGTTGGG GGTCAAGGTT 
CCGCTTTGA

Protein sequence

MLTNATPSPL SEADLLARFA QFVRLDTADG NASDDTVKTY ACTVKQFLGW CDAQRLHPLD 
ATRDDLKSYR RWLVDGQQYK CATIALKLTV VRRFYAGAVE RGLILANPAL GIKPPRETID 
PAERINYLEE AEVTRLLESL PTENTVGALR DRFLVAVMVL EGCRTVEMHR ASIGDIVKRG 
GDIGIRVSGK RSRRIVPLTP DLAKLLNKYL NARKRSGEAL LADTPLFIAL DKRTYGGRLS 
RRSIQRVIDK YLQASGLKEQ PTKQKSPKRA SNQSHQPSSG EKQRSSQSAS STSTKFQQPE 
RQLSAHSLRH TAGTLAIRAG SDLRQVQDLL GHADPRTTAL YAHVADRWRN NPALRLGVKV 
PL