Gene Franean1_2540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2540
Symbol
ID	5670934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3019940
End bp	3021007
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	66%
IMG OID	641241456
Product	integrase family protein
Protein accession	YP_001506876
Protein GI	158314368
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCGCG ACCTGCGGGA CCAGCGGCCA TCGGCGGCGT CTGCCGACGA GTTGGCGATG 
TTCGAGACGG ACGTGCTCGC GGGGTTCGTG CTCGCCCGGT CGTCGGCCGG GCTGACGGAC 
GGGACGATCC GTAGCGACGT CGGGAACCTG GAACAGATCC GCTCCTGGTT CGGCCGGGCG 
CTGTGGGAGA TGGAGCCAGC CGACGCCGAC GTCTATTTCG GTCGGGTGCT GCGGGGTTCG 
CCGAGTGGGA CACGGCTGGC CAGGGCGGCG GCACTGAGCA CGTACTTCGA GTTCGTGGAG 
TTGCGCCACA AGGTCGAGAT TCACAGGATG ACCGGACGCG TCGTTCAGTG TCCGCTGGAT 
GAGATGAACC GGCCGCGTGG AAGCAAGGAC GCGCGACTGC GGATTCCGCC GGTCGATCGC 
GAGATTGCCG AGTTGTTCTC CGGCTGGTCG CGCGAATTGG CGACCTGCCG GAAGTTCGCT 
CCGAGCGCTC GCAACTACAC CGCGGCGCGG CTGATGGCGG AGGTGGGACT GCGGGTGAAC 
GAGGCCCGCT CGCTGGATCT CGCGGACATC CGATGGGAGC TGGGCCGCTT CGGCAAGCTC 
CATGTCCGTC ACGGCAAGGG CGCGCACGGT TCGGGGCCGC GAGAACGGAT GGTGCCGCTG 
ATCAACCATG CGGGGCAGAC GCTGCGCTGG TACGTCGAGG ACGTGTGGGG TCACTTCGAC 
GAGGACCACA CCCGTCACGG CGCTCCGCTT TTCCCTTCCG AGCGGCGCAA TGTCGACGGT 
GCACCCGCAC GTGTCGGCTA TGACGCGTTG CGTTCGGGGT TGGCCGCCGC CGCGGCCGAG 
CACCTCCCCG CGTGGAAAAG CAGGCTCACT CCCCACATTC TGCGTCATTA CTGCGCTTCC 
CAGATGTACC TCAACGGGAT CGATCTTGTT TCGATCCAAG AGATGCTCGG GCATTCCTGG 
GTGGCTACGA CAATGCGTTA TGTTCATGTG CACCGCACCC GCATCGAGGA CGCCTGGATC 
GCGGGGCAGG GGCGAGCCGC ACAGCGGTTG GAAGGGCTGG TCCAGTGA

Protein sequence

MVRDLRDQRP SAASADELAM FETDVLAGFV LARSSAGLTD GTIRSDVGNL EQIRSWFGRA 
LWEMEPADAD VYFGRVLRGS PSGTRLARAA ALSTYFEFVE LRHKVEIHRM TGRVVQCPLD 
EMNRPRGSKD ARLRIPPVDR EIAELFSGWS RELATCRKFA PSARNYTAAR LMAEVGLRVN 
EARSLDLADI RWELGRFGKL HVRHGKGAHG SGPRERMVPL INHAGQTLRW YVEDVWGHFD 
EDHTRHGAPL FPSERRNVDG APARVGYDAL RSGLAAAAAE HLPAWKSRLT PHILRHYCAS 
QMYLNGIDLV SIQEMLGHSW VATTMRYVHV HRTRIEDAWI AGQGRAAQRL EGLVQ