Gene Francci3_3668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3668
Symbol
ID	3905352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4393666
End bp	4394823
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	72%
IMG OID	637880994
Product	hypothetical protein
Protein accession	YP_482749
Protein GI	86742349
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGGA TCGGCGCGGT GGATCCCGCG CTCACCGGCA CCGTCGGCTC GGGTTCATAC 
GATCCGGCGG ACGTGACCTT CCTGCTGACC GACCTCAGCG CGGTCGCCCT GGAGCGGCCC 
ACCGAGGACC GTGAGGAGGC CATGCAGGCC GGCCGGCACT ACTCCGAGGA CCTGCCGGTC 
GAGTACCAAC CCGACGCCGG TTACCTGGAG CTCTACCACC GGGCGCTGGA CCGGTCGGCC 
CGCCGGGTCG CGCTCGCCAC CGGCCTCGTG GCGGAGCTCG TACGGGTCAC CAAGCCCGAG 
CCGGTCCTGG CCTCGATCGC CCGGGCCGGT ACCCCGGTGG GGATCCTGAT GCGGCGCTGG 
TACGGCTGGC GCCACGGGCT CGACACCCCG CACTACGCGA TCTCGGTGAT CAAGGATCGC 
GGCGTGGACC TGAACGCGAT CCGCTACCTC ACCTCCCGGC ACGACCGGAA GGTGATCCAG 
TTCGTCGACG GCTGGACCGG CAAGGGGGTG ATGACCCGGG TGCTGACCGA CGCGGTGGCC 
CGGCTCGGGC TGGACGACAC CCTCGCCGTG CTGGCCGACC CGGCTCGGTG CGTGCCGCTC 
TACGGGACCC GCGACGACTT CCTCATCCCG AGCGCCTGCT TGAACTCGAC GGTGAGCGGG 
CTGGTCAGCC GGACCGTCCT CAACGCCGAG CACATCGGTC CTGATGACTT CCACGGTGCG 
AAGTACTACG CCGAACTCGC GGCGCACGAT CTGTCCCGGC ACTTCGTCGA GACGGTGGCG 
GCCCACTTCC CCGAGGTGGC CGACGAGGTC GCCGAGACCT GGCCGCGGCT GTGGGCCGCC 
GACCGCAGTC CGACCTGGGC GGGCTGGGCG GCGGTGGAGC GCATCGCGGC CGCGTTCGAC 
ATCCCCGACG TGGTCATGGT GAAGCCGGGG GTGGGGGAGA CGACCCGGGT CCTGCTGCGC 
CGGGTGCCCT GGCGCATCCT CGTCGCCCCC GACCGGCTCG ACGAGCTGAC GCACGTGCTG 
GCCCTGGCCG CCGACCGCGA CGTCGAGGTC CAGGAGCTGG CGGACCTGCC ATTCTCCTGT 
GTGGGGCTGG TCCGCCCGGT CGGCGCGGCA CCGGTCTTCC ACACCCCGAA CGCGCGCTGG 
CGCCCGGACG TCCTGTGA

Protein sequence

MSGIGAVDPA LTGTVGSGSY DPADVTFLLT DLSAVALERP TEDREEAMQA GRHYSEDLPV 
EYQPDAGYLE LYHRALDRSA RRVALATGLV AELVRVTKPE PVLASIARAG TPVGILMRRW 
YGWRHGLDTP HYAISVIKDR GVDLNAIRYL TSRHDRKVIQ FVDGWTGKGV MTRVLTDAVA 
RLGLDDTLAV LADPARCVPL YGTRDDFLIP SACLNSTVSG LVSRTVLNAE HIGPDDFHGA 
KYYAELAAHD LSRHFVETVA AHFPEVADEV AETWPRLWAA DRSPTWAGWA AVERIAAAFD 
IPDVVMVKPG VGETTRVLLR RVPWRILVAP DRLDELTHVL ALAADRDVEV QELADLPFSC 
VGLVRPVGAA PVFHTPNARW RPDVL