Gene Francci3_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2108
Symbol
ID	3905635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2474326
End bp	2475531
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	66%
IMG OID	637879443
Product	hypothetical protein
Protein accession	YP_481209
Protein GI	86740809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0876721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.445342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGGAG CCGAGTTCGG CAAGATCATG CAGCGGATCG GGGGCCGCCT CATCGTGACC 
GATGGGGAGA AGGCCACGAC CTACGATTTC CGCCGGCAGC GCGACCGTGA CTCATGGCAT 
GGCGCGGTGG GGAAGTCCGT CAGTGATTCG GGTTTGAAGT CCGAGCTGGT CAAGCGGAAG 
TTGGACGCGA AGCGCGAAGC CCTGGAGTTC CTGGGTGGCC CCGTGGGGTT CGGGTGGTCC 
CAGACGATCA CCCGGTCAGG TAAGAAGATC GTGACGGTGT GGTCCGTCGA CGAGGAGCAG 
GCCCGCTGGC TACGCGAGGC CGCGCGGCGT ATCCGCGAAG GTGAGGCCGT TCTCAAGGTC 
TCGGATGATT TCTACGACCG TGGGCTTCGG ATCCCGCACC GGCGCACGCA CCCGGGCGAC 
ACGATGAAGA GCGGCAGCCT GACGCGCGCC AGCCTCTCCG CGATGCTGCG TAACCCGAGG 
ATCGCTGGTC TGTTCGCGAC GGGAAACGTT CACACGGGCT GGACCGTGAA GGGCCCGATG 
GCGAACTTCC CCGCGATCCT CACCGAGGAG GAGTGGCGGG AGACATGCGC GGCGCTGGAA 
GCGGTCACGA CCCGCAAGGG CACGGGTACG GCCGTCAAGC ACACGTTCGC CGGGTACTAC 
GTGTGCCACA AGTGCAGGCG TTCCCTGGTC CGGAACTCTC CCCGCGCGTA CGCCCTGTGG 
CGGCATCGTC TCGGGAAGAG CCGTGAACAC TTCGAGTGTG ACCAGTCGTT CCACATCAAC 
GCCGCCGACG CGGACGACCT GATGACCCGC CTGGTTGACG CCTACCTACG CCGCCGAGAC 
TGGGAGAAGA CCGGCGACGT CGCGGACGGT GACGAGCTGA AGGCCGAGCG GACCGAGAAG 
GAACGCGAAC TGGCCGATCT TCCCCGCGCG ATCGCCGCCA AGGAGATCAG CCTGCGGCTG 
GGTGGCCAGC TCGAGGCCCA GTACGAGACC CGGCTACGGG AGATCGACGC CGAACTGGCC 
CGCCGCGCGC GTCTCGTGAC CGTCCTGGAC GGAGCGGAAG CGCTCCGACT CTGGCGCGGA 
GGCACCCTCA CGGAGAAACG CCGTGTCCTG TCAACGATCA TGGTGAAGAT CATTGTGGTT 
CCCGGGAAGG ATCTTCCGTT GCGGGAACGG CTGGACCCGC AATGGCGCTA TCCCGGACCT 
GCCTGA

Protein sequence

MVGAEFGKIM QRIGGRLIVT DGEKATTYDF RRQRDRDSWH GAVGKSVSDS GLKSELVKRK 
LDAKREALEF LGGPVGFGWS QTITRSGKKI VTVWSVDEEQ ARWLREAARR IREGEAVLKV 
SDDFYDRGLR IPHRRTHPGD TMKSGSLTRA SLSAMLRNPR IAGLFATGNV HTGWTVKGPM 
ANFPAILTEE EWRETCAALE AVTTRKGTGT AVKHTFAGYY VCHKCRRSLV RNSPRAYALW 
RHRLGKSREH FECDQSFHIN AADADDLMTR LVDAYLRRRD WEKTGDVADG DELKAERTEK 
ERELADLPRA IAAKEISLRL GGQLEAQYET RLREIDAELA RRARLVTVLD GAEALRLWRG 
GTLTEKRRVL STIMVKIIVV PGKDLPLRER LDPQWRYPGP A