Gene Francci3_0067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0067
Symbol
ID	3905402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	83126
End bp	84502
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	57%
IMG OID	637877397
Product	HNH endonuclease
Protein accession	YP_479190
Protein GI	86738790
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACGATGG TCCCATCGCG CGCCATAATC GAACACATGT TCGGTAAAGA TCTGGAGACG 
GTTCCCCTCC CTGCCCTCGA GACGGAACTC TGCAGCTGGG CGGGTCGACT GGCTGCCGCC 
ACCTGCCGTT GGCTGATTCT GCTCGCTGCC TTCGATCGCC GCAAAGGTTG GTCCGCCAGC 
GGCATGCCGA CCTGCGCGCA CTGGTTGTCC TGGCGGTGCG GACTCGGACT TCGCGCCAGC 
TACGACTACC TTCGAGTCGC CCGAGCACTA GAACTCCTTC CCCTCATTCG CGAGTCCTTC 
TCCAAAGGAG AGATCTCCTA TTCAAAGGTT CGGGCTATAA CACGTGTCGC CGAGCCGGAG 
ACGGAAGCAA GGTGGGTTGA GCAGGCCGCA CAGTGCACAG CGCAGAAGCT CGAGAGACTC 
GTGTCCTTGC ATGCCAAAAT CAATCATGAT CAAAAAGATG AGAACGGGGG GCGCGACGAA 
GATGGCCCGA ACAATACGCG GTGCTCTTGG CGGTGGAACG AAGATGGAAC ATTTTCACTG 
TCCGTCCGCC TCGATCCAGC CCGTGGTGCG ATCATTGAGA GCGCTCTCGT CATGGCCATG 
TCAAGCCTGC ACGACTCCCG AGACTCTAAC CGGGAAGATT CTTCCACGAC ATCCGATGCC 
GAGGGCTCGA TCAATGACAC CTCGATAACA CACGCAGGTC CTGAGATGAA AGCCGATGCC 
TTGACGGCTA TGTCCGAATC TTTCCTCTCC ACCGGCGCTC CCACGCTGAT GAGCTCCACA 
TCTCACACGA TAAATGTACA CATAGATATT GATACACTTA TCGGTTCAAG CCGAGAGAAC 
CATGGATCCC CCCTCCAGCG ACATGAAGGG AATGGACTGA ATACCCGAAG GTGTGATGTG 
AAGGACCATA TCCCCGTTCT ACCGAACGTC GTTCGAAGAC TGTCCTGCGA CAGCCTCCTT 
CGGACACTTA TTATAGACTC CAAGGGAAAC CCTCTCATGC TGGGTCGCAC CCGCCGAAAC 
CCAACCACGA GATTGCGGCT AGCAATTTAT GCACGCGACC GAGGGGTATG CCAGTATCCG 
GGCTGCCATC ATACCCGCTG GCTCCAGGTA CATCATATGA AGGAATGGGC ATCCGGAGGC 
GGAAATACAG ATCTTGATAA TCTCGTTCTG ATCTGCTCCC TTCATCATCG GACTATTCAT 
GAAAGGCGGA TTGTTCTGCA GCGCGGACGC GACGGTTCGA TTGTCGCCCG CCATCGTGAC 
GGAACGCTGA TGCAGCAGGC GCCACGGCTG CATCTGGGTC CGGATCTGTT GGAGCTCCTC 
AGCGATAACA CCTCAGCCGC GCCAGCTGAG ACCGTCCCGA CAAGACGAGT AGCCTGA

Protein sequence

MTMVPSRAII EHMFGKDLET VPLPALETEL CSWAGRLAAA TCRWLILLAA FDRRKGWSAS 
GMPTCAHWLS WRCGLGLRAS YDYLRVARAL ELLPLIRESF SKGEISYSKV RAITRVAEPE 
TEARWVEQAA QCTAQKLERL VSLHAKINHD QKDENGGRDE DGPNNTRCSW RWNEDGTFSL 
SVRLDPARGA IIESALVMAM SSLHDSRDSN REDSSTTSDA EGSINDTSIT HAGPEMKADA 
LTAMSESFLS TGAPTLMSST SHTINVHIDI DTLIGSSREN HGSPLQRHEG NGLNTRRCDV 
KDHIPVLPNV VRRLSCDSLL RTLIIDSKGN PLMLGRTRRN PTTRLRLAIY ARDRGVCQYP 
GCHHTRWLQV HHMKEWASGG GNTDLDNLVL ICSLHHRTIH ERRIVLQRGR DGSIVARHRD 
GTLMQQAPRL HLGPDLLELL SDNTSAAPAE TVPTRRVA