Gene Francci3_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1074
Symbol
ID	3906417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1279455
End bp	1280705
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	75%
IMG OID	637878408
Product	hypothetical protein
Protein accession	YP_480185
Protein GI	86739785
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0537877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGAGG ACGACGTCAT CAGCACGGGC GTGACCTGCG CGCGCCCGCA GCCCGTCGGG 
GTCTTTCCGC TGCCGGCCGG CTTCCTGCTC GTGCCGGGCG GCGAGGCCAC GGCCGACCTG 
CGCCGGACAC TGGCGGCCGG GAAGGTGCCG GTGGCCTGGC CGGCGGAGCT GGCCGCGCTG 
GAGCTCGCCT ACCGCGGGGA GGTCGTCGCG GCCCTCGGGC AGCTGCGCGG CGACGACCCG 
GTCGACCGCT ACAACCGCTT CGTGCTGCGA CCAGCGGGCG CGGACCCCGA AGACCCGGTG 
GCACTGCGCC GGGCGCTCGG CGACGAGCTG GGGATCCTGG TGGACGTAGT CCGGTTCGCC 
CTGGGCGAGC TGGACGAACC TCCGCCGCCC GGCGGGGAGA CCGACGAGAT CGCGGCGATG 
GTGTGGTCCG CACACGCCGC CCACGCCATG GCCGCCGGCC GGACGGGCGA GGCAGCGGGG 
CTGCTGGAGC GGGCCATCGC CGCGGCGCGG GAACCCTCCC CCGGTCTCGC CGCCCAGCTC 
AGGTCCACCG CGGCGGACCT GCGTCGCGGA GTCGAGGGAC CGAGCCCGGC CGTCATCGCA 
GAGCTGACGG CGGCGCTCGC CGCGCTGGCC GCCACCGACC TCACGGTCGG CCGGGCCGAG 
TTGCACCTGA GCCTCGGTTC GGCCTACCAG GAGCTGGCCG GGGACGATCC GGCGGGCCTG 
AAGGTCGCGG TGGAGCACTA CCTCTCGGCG CTGCGCCTGG TCCGCATCGA CACCGCCCCG 
GAGCTGTTCG CGGCGGCACA GGTCAACCTC GCCACGGCGT ATCTGACCAT GCCGATGGCG 
CAGGCGTCCG ACCAGCTGCG GGTCGGCGTG GCTGTGCAGG GCCTGCGGAC CGCTCTGTCC 
GTCTACACCC GCGAGACTCA TCCCGAGCGG TGGGCCAGCA CCCAGCTCAA CCTGGCCAAC 
GCCTTGGTCT ACGCGCCGTC CGCACACCGG GAGGACAACC TGCGGGAGGC GGTCGCGCGC 
TACCAGGAGG TCATCGCCGC CCGCGACCGC GACGCCGACC CCCTCGGCTA CGCCCGGGCT 
CGGGCGAACC AGGGCAACGC CCTGGCCCAC CTCGGCCTCT TCGACCCGGC GCAGGCGGTG 
CTGCACGAGG CACGGGCGAT CTTCGAGGAG GTCGGGGACC CCGACGCCGT CCTGGCCGTG 
CGCGGGGTGC TCGACGAGAT CGCCCGCCGA CTCACCGCGA AGCCGACGTG A

Protein sequence

MGEDDVISTG VTCARPQPVG VFPLPAGFLL VPGGEATADL RRTLAAGKVP VAWPAELAAL 
ELAYRGEVVA ALGQLRGDDP VDRYNRFVLR PAGADPEDPV ALRRALGDEL GILVDVVRFA 
LGELDEPPPP GGETDEIAAM VWSAHAAHAM AAGRTGEAAG LLERAIAAAR EPSPGLAAQL 
RSTAADLRRG VEGPSPAVIA ELTAALAALA ATDLTVGRAE LHLSLGSAYQ ELAGDDPAGL 
KVAVEHYLSA LRLVRIDTAP ELFAAAQVNL ATAYLTMPMA QASDQLRVGV AVQGLRTALS 
VYTRETHPER WASTQLNLAN ALVYAPSAHR EDNLREAVAR YQEVIAARDR DADPLGYARA 
RANQGNALAH LGLFDPAQAV LHEARAIFEE VGDPDAVLAV RGVLDEIARR LTAKPT