Gene Franean1_6721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6721
Symbol
ID	5675792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8173310
End bp	8174794
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	64%
IMG OID	641245570
Product	integrase family protein
Protein accession	YP_001510961
Protein GI	158318453
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.917048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAGGGT CCATCTTCAA GAAATGCGGC TGCCGCGACC CTATGACGAA ACGGCAGCTA 
GGAAGAGCGT GTCCGAAACT TCGCCGTTCG AACGGCGGCT GGCGAACCGA CCATGGAACC 
TGGGCCTACC GCATCGACCT GCCGCCCCAC CCTGACGGTA GGCGCCGCCT CGTCAGCCGC 
AGCGGATTCC CCACCCAGGC CGAAACGCGC GCAGAATGCG AACGTATCGA AGCCCTCATC 
GCCATCCCCG ACGCAGGAGA CAACACCGGC CGCCAAAGCA TCGCCGACAT CATCGGCAAC 
GCCATCAGCA CCAACAAGCC CCTCCCTGAC ATCGACGACG TCAAGAACCG ATACCGGCGC 
AACGCGGACC TCAACCCCGA CATCACCATC AGCGCCTGGA TGGAACGCTG GCTCGCCAGT 
AGAAAGAACA TCCGACCGAA AACCCGCCTG GGCTACGAAA GTTACATCAG AGTCCACATC 
ACGCCAGCCA TCGGCTCCGT ACAGCTCACC AAACTCACCG TCTCCCACCT CGACGACATG 
TTCACCGCCA TCGACAACAC CAACATCAGG ATCATCCAGG ACCTTCAATC CGACGATCCC 
CGAATCCGAC GCGCAGCCCG CGGCAAAAGA CCCACAGGAC CCGCCACCCA GCAGCGCATC 
CGAGAAGTAC TCCGCGCCGC AATCAACGAC GCCAACCGCC GAGGACTCAT GACCCACAAC 
CCAGCCAAGT ACGTCGAACT CCGCTCCGGA AAACGACCCA AAGCACTCCT GTGGACAGAT 
GAACGCGTCG CGCGTTGGCG AGAAACAGGC ACCAAACCCT CACCCGTCAT GGTCTGGACC 
CCGACCCAGA CCGGGATGTT CCTCGACCAT GCCCACAGCG ACCCGCTCTA CCCCGTCTAC 
CACCTCATCG CTTACCGAGG CCTCCGTCGC GGCGAATCCG TCGCTGTGCA CCTGGACGAC 
ATCGACATCA CCGAGGCAAC CCTCACCATC CGCTGGCAGT TCGTCCAGAT CGGCTACGCC 
ACCCAACTCG CAAAGCCGAA ATCCGACGCC GGGGACCGTG TCATCTCCCT CGACCCCGAC 
ACCCTCGCCG TCCTGAAAGC CTGCAGAACC CGCCAACACA CGGCCCGACT CGCCGCCGGT 
ACGGCCTGGC CGAACAACGG CCTCGCGTTC ACCCACCCCG ACGGCAGCCC CATCCACCCC 
GAACATCTCA CCAACCGCTT CCAGACCCTG GTCCAGGAAG CCGACCTACC ACCCATCACC 
ATCCATGGCC TGCGCCACGG CGCCGCCACC CTCGCCCTCG CCGCCGGAGC CGACCTCAAA 
GCAGTCCAAG AGCTCCTCGG CCACTCCACC ATCATGCTCA CCGCCGACAC CTACACCCAG 
ATCCTCCCCG ATCTCGCCGC CGAGATCGCC CGCAACACCG CCCGCCTCAT CCCCCGCACC 
CGCAGCCCCC ACGACTACCC CCGACACCAC ACCACGACCG ACTAA

Protein sequence

MKGSIFKKCG CRDPMTKRQL GRACPKLRRS NGGWRTDHGT WAYRIDLPPH PDGRRRLVSR 
SGFPTQAETR AECERIEALI AIPDAGDNTG RQSIADIIGN AISTNKPLPD IDDVKNRYRR 
NADLNPDITI SAWMERWLAS RKNIRPKTRL GYESYIRVHI TPAIGSVQLT KLTVSHLDDM 
FTAIDNTNIR IIQDLQSDDP RIRRAARGKR PTGPATQQRI REVLRAAIND ANRRGLMTHN 
PAKYVELRSG KRPKALLWTD ERVARWRETG TKPSPVMVWT PTQTGMFLDH AHSDPLYPVY 
HLIAYRGLRR GESVAVHLDD IDITEATLTI RWQFVQIGYA TQLAKPKSDA GDRVISLDPD 
TLAVLKACRT RQHTARLAAG TAWPNNGLAF THPDGSPIHP EHLTNRFQTL VQEADLPPIT 
IHGLRHGAAT LALAAGADLK AVQELLGHST IMLTADTYTQ ILPDLAAEIA RNTARLIPRT 
RSPHDYPRHH TTTD