Gene Francci3_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2030
Symbol
ID	3906747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2387389
End bp	2388540
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	69%
IMG OID	637879367
Product	hypothetical protein
Protein accession	YP_481133
Protein GI	86740733
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.382188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACG TCGGAACAGA CCCGGCCGAC GAGAACCTGC TCGCCTGGTT CCCGCTGGTC 
CAACGCCCCC GACCACCCGG CCTCCCCCTC GAAGACCGAG TCAGACAGCT GCACGACCTG 
GCCGCACGGA CATCGGACGG TCTCCCGCTC CTCCGAGCGG CCGAAGTCTG CAACAAGGCG 
GCGCTGATCG CCTCCGACTG CGGACAACCA GACCTCGCCC AAGACCTGTG CTGGCGCCAA 
CACACGCTGT TCGATCAGGC GCGGCCCCTG CCCGCCTCAG CCGCCGAACT CGCCCTCCAA 
CCGGTGCTCA ACCTCCCGCG CCAACTGATC CGCGATGGTG ACGGCAACCG CGCTCACGCG 
ATCCTCCAGG CCCTGCACGA GGCCGCGCGC ACGCAGACCA GCGCACTGAT CGACGGACGG 
TCCGTCAGTC TCCACAACGT CACCTGCGCC TCCGACGACC ATCGGACCAT GCGCACCCTG 
ACCTGGACGG CGCTCCTGGC GGACGGAGTC CGGGCACTGG CACGGGCCGG GCGCTGGCAC 
GAAGCCGCCG AACAAGCCGC GGCCCACCGC GGAGTCGGCC GCCGACTGCT CGACGGCCGA 
CAGGCGACCG TCCTGGCACT CGCCCAGGCC GGGCACACCG AGCAGGCAGC AGCGCTGGTC 
GACCAGAGCG CCACCCCCGA ACCGTGGGAA CAGGCGATCC AAACAATCCT GCGGGTGCAC 
TGTCTGCGAC AGGCTGGCGC CGACACCGGC CCGCAGATCG CCCCGCTCCT CGCCACCGCG 
CTCACCCTGA TGCGGCAGCC CGACCTCTCG ACCATGGTCT TCCGTGCCCG AGCAGGCATG 
ATCGCGCTCG ACCTCGCCGA CGGCCACGAC CATCCGCGCA TCGACGTACT ACGCCGGGCG 
CTGATCGCAG GTACGTTCAA GGACGCGTAC ACGGCCCGCG ACACGCTCGC GCACCGCCTC 
CGGGAGTCGA TGACGACGAC GCAGCGCCAA ACCCTGGCCG ATGTCTTCCG CGCCGCCGGG 
CTCGATGCCG GAAGCATCCC GGAATCGCTG TACGGCGATT TGATGGAGAC GGTGAAGTTC 
GCCGAAGATC AGCTACGTGG ATGTCTCGGA CGCCACGCCA GGCACTGCGA GTGCACAACA 
GCGACAAGCT GA

Protein sequence

MTNVGTDPAD ENLLAWFPLV QRPRPPGLPL EDRVRQLHDL AARTSDGLPL LRAAEVCNKA 
ALIASDCGQP DLAQDLCWRQ HTLFDQARPL PASAAELALQ PVLNLPRQLI RDGDGNRAHA 
ILQALHEAAR TQTSALIDGR SVSLHNVTCA SDDHRTMRTL TWTALLADGV RALARAGRWH 
EAAEQAAAHR GVGRRLLDGR QATVLALAQA GHTEQAAALV DQSATPEPWE QAIQTILRVH 
CLRQAGADTG PQIAPLLATA LTLMRQPDLS TMVFRARAGM IALDLADGHD HPRIDVLRRA 
LIAGTFKDAY TARDTLAHRL RESMTTTQRQ TLADVFRAAG LDAGSIPESL YGDLMETVKF 
AEDQLRGCLG RHARHCECTT ATS