Gene Francci3_1226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1226
Symbol
ID	3902971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1467635
End bp	1468891
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	72%
IMG OID	637878559
Product	exodeoxyribonuclease I subunit D
Protein accession	YP_480333
Protein GI	86739933
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0802336
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAACCG GAACAGCCAG AAAGGCGCGC AGTTCGGACC CCCATGACGA TCATCTCGAC 
GGGATTGCCT ACCGTGCTCG CATGCGTGCG CTGCACACGT CCGACTGGCA TCTCGGGCGT 
GGCCTGTACG GTCACGACCT GATGCCGGCC CAGGCGGCCT TCGTCGATCA TCTCGTCGAC 
GTCGTCCGTT CCGAGGGCGT TGACGTCGTG CTCATCGCCG GCGACGTGCA CGATCGGGCG 
ATCCCGCCGG TGGGCGCGCT GGAGCTCTTC GACGAGGCGC TCTCCCGACT GCGCGATGCC 
GGCGCCCGGG TCGTGGTGAT CAGTGGCAAC CACGACGCGG CCCGCCGGCT CGGCGACAAG 
GCCGGCCTGC TCGACCCCCG CGTCCGCATC CGGACGGATC CGGCCGCGGT CGGGGATCCG 
GTCGTCGTCG AGGATCCCGC CGGGGCGGTC CGGGTGTACG CGATCCCCTA CCTGGAGCCG 
TCGGCGGCGA ACTCCCAGCT TCCCGAACCG GCGCAGGCGC CATCTGGCTC GGACGTCCCG 
GCCGCCGGGA TCCCCGCCGC GACGATGCAC CGGGCGATGC ACGCGGTGCG GGCCGACCTC 
GCACGGTATC CGGATGCCCG GTCCGTCGTG GTGGCGCACG CCTGGGTCAC CGGCGGGGCG 
GCGAGCGAGA GCGAACGCGA CATCAGCGTC GGCGGGGTGG GCAATGTGCC GGCCCGGTTG 
TTCGAGGGGA TCACCTATAC CGCGCTCGGC CATCTGCACC GGCCACAGGC GATCGCCCCG 
TCCGTCCGCT ACAGCGGATC GCCACTGGCC TACTCCTTCT CGGAGTCCGG CGACGCGAAA 
GCGTCGCTGC TCGTCGAGAT CGGTCCGACC GGGCTGGGGA ACGTGACCCG CATCGGCGTT 
CCCGCCCGGC GGCGGATGAC CCTGCTGCGC GGCAGTCTTG CCGACCTCCT CACCGACCCC 
GCCCATGCCC CGCACGAGGC CGACTTCGTC TCCGCCGTGC TGACCGACCC CGTCCGCCCC 
ATGGACGCCA TGGCCCGGTT GCAGCACCGG TTCCCCTTCG CCCTACGACT CGCGCACGAA 
CCGGAGACGG AACCAGACGA GATACTCAGC TTCGGCCGGC GGACCCGGGG ACGCTCGGAG 
CTGGAGATCG CCGAGGCCTT CGTCGCCCAT GTACGCAGCG CTCCCTCGGC TCGGGAACGT 
GCTCTGCTCG CCGAAGCCCT CGGCGCCGCC CGCCGGGCCG AGGAGGAAGT CGCCTGA

Protein sequence

MITGTARKAR SSDPHDDHLD GIAYRARMRA LHTSDWHLGR GLYGHDLMPA QAAFVDHLVD 
VVRSEGVDVV LIAGDVHDRA IPPVGALELF DEALSRLRDA GARVVVISGN HDAARRLGDK 
AGLLDPRVRI RTDPAAVGDP VVVEDPAGAV RVYAIPYLEP SAANSQLPEP AQAPSGSDVP 
AAGIPAATMH RAMHAVRADL ARYPDARSVV VAHAWVTGGA ASESERDISV GGVGNVPARL 
FEGITYTALG HLHRPQAIAP SVRYSGSPLA YSFSESGDAK ASLLVEIGPT GLGNVTRIGV 
PARRRMTLLR GSLADLLTDP AHAPHEADFV SAVLTDPVRP MDAMARLQHR FPFALRLAHE 
PETEPDEILS FGRRTRGRSE LEIAEAFVAH VRSAPSARER ALLAEALGAA RRAEEEVA