Gene Francci3_2249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2249
Symbol
ID	3905017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2625361
End bp	2626563
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	73%
IMG OID	637879580
Product	hypothetical protein
Protein accession	YP_481346
Protein GI	86740946
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.178896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0169259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCGCT CCATGGGCCG GTCCGTGGAG CGGTCCGTGG GCCGGCTCGT CGACTCCACC 
CCGCCGTCCC GGGCGCGCGA CGTCGACTTC CTGCGCCTGG CGAGCGTCTG TGTCGTGGTG 
CTGTGGCACT GGGCCCTGTC CATCGACCAC TTTCGCGGGG GCGTCCTCGT GATGCCCAAT 
CCGATCGCGC GGATACCGTT CGCCTGGCTC GCGACCTGGC TGCTCCAGGT GATGCCGGTG 
TTCTTCGTCA TCGGTGGCTT CGCCCACCTG GCGGCCTGGG ACGCGGCCGG TCGCGCCACG 
GGGTCCCCGC GCGATGATCC CGCGCGTCCC TGGGGCCCGC GGGCACGGCG CTTCCTGCGG 
GGGCGGCTGC GCCGCCTGTT GCCCCCGATG GCGGTGTTCG CCGTCGTCTG GGCGGCGGTC 
GACGCCGTCC TGCTGCTCGC GGTCCCCGAC TACCCGGGTC TGCTGCGCTA TGGACGGGCC 
GTGCTGGTGC CGCTGTGGTT TCTCGCGGCG TACCTGGGGG TCATCCTGGT CGTGCCGGTG 
ACCGCGGCGG TCCATCGGCG GTTCGGCCGC CGGTTCATCC TGCTGTTGGG CGCGGTCGTG 
GCGCTCGTCG ACCTGGCGCG GTTCGGCACC GGCAGCACGG TGTTCGGCTA TGTCAACACC 
GGTCTCGTCT GGGTTTTCGC CCACCAGCTC GGGTATTTCT GGCGGGACGG CGTCCTGCGC 
GGGCCGCGGC GGGCGCTGCT GACGGCGCTC TGCGGGCTGG CGGGGCTGGC CCTGGTGACG 
ACGCTCGACG AGTATCCGCG ATCGATGGTC GCCACCGAGG GAGCCAGACG CGGCAACATG 
TTCCCGACGA CCGCTGCGAT CGCCGTGCTC GCCGTCTTCC AGCTCGGTCT GATCCTGCTC 
GCCGCACCCG CCCTGAACCG GATGCTGGCC CGGCGCCGGC CGTGGACGGC GGTCGTCACG 
GGCAACGCCG TGATCATGAC CGTGTTCCTG TGGCACATGA CGGCCCTGCT GCTCGCGATG 
GTCACGATGC GGGCGGTCGG GCTGCCGATG CCCGACGAAC CGACCGCGAC CTGGTGGGCC 
GGGCGACCGC TGTGGGTGAT CCTGCCCGCG CTCTTCCTGG CGCCGTTGAT CGTCCTGTTC 
GCGCCGGTGG AGCGCGGGGC CGCGGCCCCG CGTGGACCGG CGCGCACCGG GCCGGACGAC 
TGA

Protein sequence

MGRSMGRSVE RSVGRLVDST PPSRARDVDF LRLASVCVVV LWHWALSIDH FRGGVLVMPN 
PIARIPFAWL ATWLLQVMPV FFVIGGFAHL AAWDAAGRAT GSPRDDPARP WGPRARRFLR 
GRLRRLLPPM AVFAVVWAAV DAVLLLAVPD YPGLLRYGRA VLVPLWFLAA YLGVILVVPV 
TAAVHRRFGR RFILLLGAVV ALVDLARFGT GSTVFGYVNT GLVWVFAHQL GYFWRDGVLR 
GPRRALLTAL CGLAGLALVT TLDEYPRSMV ATEGARRGNM FPTTAAIAVL AVFQLGLILL 
AAPALNRMLA RRRPWTAVVT GNAVIMTVFL WHMTALLLAM VTMRAVGLPM PDEPTATWWA 
GRPLWVILPA LFLAPLIVLF APVERGAAAP RGPARTGPDD