Gene Francci3_1511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1511
Symbol
ID	3904977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1802483
End bp	1804384
Gene Length	1902 bp
Protein Length	633 aa
Translation table	11
GC content	72%
IMG OID	637878848
Product	hypothetical protein
Protein accession	YP_480616
Protein GI	86740216
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCT ACGCCCGGCC CGGTCGTCGG CCCGGCGATG CGCCCCCGGT GTGGCGCAGC 
CGCCGGGAGA ACGAGCTGTT CGCCGGTCGC GACGACGAGC TGGAACGCAT CTGGGACGGC 
CTGACCCGGC ATCGGCGGGT GGTGCTGGTG CCGGAGGGGG ACCAGTCCGA CATCGGGGAG 
ACCGAGCTCG CCGGCGAGTA CCAGCATCGG TTCAAGCTGC GCTACGACGT CTCGTGGTGG 
GTGGACTGCT CGACGACCGC CGCCGTCCCC GGGCAGATCG GCGAGCTCTA CGAGCGGGCC 
CGCACCGAAC TTCCCGGCCC CCCTCCGGGC GCGGCCGACG CCGGGCCGGA GTCCACCGCG 
GGATGGTTGG TCATCTTCGC GGGTGTGGGC AGTCCGGACG AGGTGGCGGA GTTCCTGCCC 
GACGGCGAGG CGCATGTGAT CATCATCGCC GACCGCGCCG TGGGCGCCTG GCGGGACCGG 
ACGATGCCCA TCGGGCCATT GCGTCGTCGC GAGTCGGTCA TGCTGCTCAC CAGCGCGGCG 
CCGATGGTCG ACCCGGCCAC CGCCGCCCAG CTGGGGGAGT TGGTCGGACA CCGGCCCGCC 
CTGCTCGCGG AGATCGCCGG GTACCTGATC CGCGAGGCGG TCGTGTCGCC GGAACTGTGT 
CGGCGCCTGC TGGAGATGGC GGCGTCGCGG CCGACGCCGG CCGTCCGGGA CGCCGCCGGC 
GGTGACCAGT CGTCCCGGGC CCAGGCGATG CGTGGTTCCG GAACCCCCGC CGGGGCCGCG 
TCCGGGGCCG CGTCCGGGGC CGCAGCCGGG GCCGGGGCCG CCGTCATGGT CGCAGGCGAG 
GTACGTGACC CGGTAGGGCG CAACGCGGCG CGGGCACCAT CGATTCCTGT GATCAACAAG 
CACGGCTGGC CCCCCCGGGA GGTCGACGAG CTCGTCGCGG CCCTGATGCG GGTGGAGTAC 
ATCGCTGACC TGGCCGGTTT CGACCACTGG TTCGACGAGC TGACACGGAT CCTCGGTCGC 
ACGATCGCGC TGACCTCCCC GGTCGTCGCG GTCCGCCTGA CCACGCTGGT CAGCGAGGCG 
GTCGGCCAGC CCGATCCCGG CATGCTCGAC GCCTTGCTGC AGGCCCTCGA CCTGGTCGCG 
CCGCGCGACG ACCGGTCCGT CGTGGACTTC CGGCGCTTGG TGACCGAGCT GCAATCCCAC 
TGGAGCGGCG CGGGCTCGGC GCTGCCCGGC ATGTCATCAC CGGTGCCCGC CTACCAGCTT 
CCCTCCTGGC CACCGCTGCT GTCTGGAGTG CCCTCCTCAC CCCCGCCCAG CCACGGGCCG 
TCGGGCACCC CGACCTACTA CTTCTTCACC AGCCACGCGC ACCGCGACGA CCGGGATCGC 
GTGGCCATCT TCCATCGGGA GCTCGAGCTG GAGCTGCGCC GCAAGGTCCG GCGCCGGATC 
CGGCCGACGG GATTCTTCGA CGCCGACCGG CTGGGCGGCG GGGAGCACTG GCCGACCTCG 
CTGCGCGACG CGGTGCGCAC GGCTCCGGTG CTGGTCGCGC TGTGGTGTGA CGACTACTTT 
GAGAGCGACT GGTGCGGCCG GGAGTTCGGC GTTTTTCAGG AACGTATCCG CCGGGCGACC 
AAGCCGGGCG GGAACCCGCC GTCCGGGATC ATTCCCGTGC CCTGGCTGCG GCGGGACGCC 
GAGGTACCCG AGGCGGCCCG TGAACTCCAC ATCGCGCATA TGGAGCTTGG TCGTCAGTAT 
GACAACCTTC CGGTCCTGGA TTTGATGCGC CATCCCGCCG CCTTCGCGGA GTATGTAAGT 
CTGCTGGCCT ACCGGGTCAT GGATGTCGCT CGCGACCAGC TGCCGCCGTT GGACGCCGAG 
GTGACGGAGC TCGTCCGTTC CCCGTTCCAC CATCAGCCGT GA

Protein sequence

MNAYARPGRR PGDAPPVWRS RRENELFAGR DDELERIWDG LTRHRRVVLV PEGDQSDIGE 
TELAGEYQHR FKLRYDVSWW VDCSTTAAVP GQIGELYERA RTELPGPPPG AADAGPESTA 
GWLVIFAGVG SPDEVAEFLP DGEAHVIIIA DRAVGAWRDR TMPIGPLRRR ESVMLLTSAA 
PMVDPATAAQ LGELVGHRPA LLAEIAGYLI REAVVSPELC RRLLEMAASR PTPAVRDAAG 
GDQSSRAQAM RGSGTPAGAA SGAASGAAAG AGAAVMVAGE VRDPVGRNAA RAPSIPVINK 
HGWPPREVDE LVAALMRVEY IADLAGFDHW FDELTRILGR TIALTSPVVA VRLTTLVSEA 
VGQPDPGMLD ALLQALDLVA PRDDRSVVDF RRLVTELQSH WSGAGSALPG MSSPVPAYQL 
PSWPPLLSGV PSSPPPSHGP SGTPTYYFFT SHAHRDDRDR VAIFHRELEL ELRRKVRRRI 
RPTGFFDADR LGGGEHWPTS LRDAVRTAPV LVALWCDDYF ESDWCGREFG VFQERIRRAT 
KPGGNPPSGI IPVPWLRRDA EVPEAARELH IAHMELGRQY DNLPVLDLMR HPAAFAEYVS 
LLAYRVMDVA RDQLPPLDAE VTELVRSPFH HQP