Gene Francci3_1822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1822
Symbol
ID	3906213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2159649
End bp	2160875
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	72%
IMG OID	637879160
Product	hypothetical protein
Protein accession	YP_480927
Protein GI	86740527
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.961315
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCAG GCACCGCGGA AGACACCGGC CGCGACACGC TCTCCAGCCG GGCACTGGCC 
GCCTCAGCGG CAATCGCGGA CCAGCTCGCC GACCCCGCCG CCGTTCCCCG AGGCCCTGGC 
CGGCGGCGAG GCCAGTCCCT CGCGGGCGGT GCAGCCGGCA TCGCGCTGCT CCACCTCGAA 
CGAGCCCGCA CCGGCCACGG CGACCCCGCC ATCGCCAACG CCTGGCTACG GGCGGCAACC 
CGAGACCCAG CCAGCGCAGG GCCCAACGCC TCCCTCTACT TCGGCGCCCC CACCCTCGCC 
TTCGTACTCG ACGCCGCAGG CCGCCCAGAC CAGCTCACCC AAGCGGTCAC CACACTCGAC 
ACCGCGACCA TCGCGGTCAC ACAGCGACGA CTTGCCGCGG CTGACGCCCG CCTCCGCGCG 
GGCCTCCGCC CGCCGCTCGC CGAATTCGAC CTCATCCGCG GCCTCGCCGG CCTCGGCCGC 
TACCACCTAC GCCGCCAGCA CCCGATCATC ACCGATGTCC TGACCCACCT CGTCCGTCTC 
ACTCAGCCCC CTGCCAGCGG AGACGGACTA CCCGGGTGGT GGACCGACCT CGACCCCAGC 
GGCGCATCCT CCCGTGACTA CCCACACGGT CATGGAAATG CCGGAATGTC CCACGGCATC 
GCCGCCTGCC TCGCCCTGCT CGCACTAGCC AACAGCCGCG GCACCGAGGT CGACGGCCAC 
CGGGAAGCGA TCGAACGGAT CTGCGCCTGG CTCGACGGGC ACCAGCAGCC TGGCATCGCT 
GGCTGGCCGG GCATCGTCAC CCCGACACCG GGCCATGACG TCAGGCAGCA GCGGTTGTCC 
TGGTGCTACG GCACCCCAGG GATTGCCCGT GCGTACCAAC TCGCTGGACT CGCCACCAGT 
GACCCGAGGC GCTGCGAGAA GGCCGAAACC GCGTTGCACG CATGTCTCGA CGACGCGGCT 
CGCCTCGAAC TGACCACCGA CATCGGCTTG TGCCACGGCC TGGCAGGGCT GGTCCACACG 
ACATCCCGGG TCGCGGCCGA CGCCACCACA CCCGAACTCG CCCAGCTCCT GCCCACCCTC 
GTCGCCCGGC TGCTCGACCA ATACCCCACC GCGCCGCACG ACCCGGAGCT TCTCGATGGC 
TTGGCCGGGG TGGCGCTTGC CCTGCACACC GCGGCCCTCG GCTCCGCCCC CGTGACCGGG 
TGGGACGCCG CCTTGCTCCT CGCGTGA

Protein sequence

MNPGTAEDTG RDTLSSRALA ASAAIADQLA DPAAVPRGPG RRRGQSLAGG AAGIALLHLE 
RARTGHGDPA IANAWLRAAT RDPASAGPNA SLYFGAPTLA FVLDAAGRPD QLTQAVTTLD 
TATIAVTQRR LAAADARLRA GLRPPLAEFD LIRGLAGLGR YHLRRQHPII TDVLTHLVRL 
TQPPASGDGL PGWWTDLDPS GASSRDYPHG HGNAGMSHGI AACLALLALA NSRGTEVDGH 
REAIERICAW LDGHQQPGIA GWPGIVTPTP GHDVRQQRLS WCYGTPGIAR AYQLAGLATS 
DPRRCEKAET ALHACLDDAA RLELTTDIGL CHGLAGLVHT TSRVAADATT PELAQLLPTL 
VARLLDQYPT APHDPELLDG LAGVALALHT AALGSAPVTG WDAALLLA