Gene Francci3_2148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2148
Symbol
ID	3905538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2515435
End bp	2516991
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	70%
IMG OID	637879483
Product	hypothetical protein
Protein accession	YP_481249
Protein GI	86740849
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTACCG CGGTCGCGGC CCCAGCCACC AAGCAGGCCA TCGGCCCAGG GGCGTCGGGC 
TGGGAGCCGG CCGCGCGGCC GGTCGGCCCG TGGGATACGG CGTCGTTGGA CGACGTGCTC 
GCGGCTGTGC CGACCTTGTC GTGGTGGAAC GCGAAGCGGC AGCAGGCGCA GCGGTCGGTT 
GCCGGTGTCG AGCTGCTGCT GGACTGGCTG GGCCGGGTGC CCGGCGGCTG GCAGGACCGG 
TGGGAGCATG CCGAGGCGAT GCTCGGTCCC AGGTGGGCGA CCTGGTCAGC CGCCATTCCC 
GAGCCCGACA GGCCCTGCGG CGAACGCCAT CGCGTGGTGC TGACCCGAGG GCTGGCCTGT 
CTGCTGCGGA TGAGGCTCGT CCGGCCGAGC TACCCGTTCC TGACCACCTA CGGGCCGACG 
ACGACGTTCG CGGTCGTCCG CGACCTGGTG AGCCCGGAGT TGTTCGCCTG CGCGGCCGAC 
GCCGCGCGGG CGTGTGGCGG CCATTCCGAG AACGTGCTCA GGAAGGCGCT GAACGTCCTG 
ACCGCGATCG TGATCCATAC CGGTGGCAGC CTGAACGAGG TGACCACAGG CGACCTCCTC 
GCGTTCCAGT CAGCCACGGC GCCCAGCCGC GGCCGGACGC GTGACGGTTC CCACCTGGCC 
TGGCAGATGA TGGTCGACCT GGGCGTCTTC CCACCGCACT CCACGCTGCA CGCCGCCATG 
CGCACCGGCC CGCAGAGCAC CGCCGAACTC GTGGACCGCC ACGGCATCGC CGACCGGCAG 
ATCCGCGAGT TGCTGATCCG CTACCTCGAC GAGCGGCGTC CCGCGCTCGA CTACAGCACC 
TTCCGCATGC TCGTCGGCCG TCTCGCCGGG GCGTTCTGGG CCGACCTCGA ACGCCATCAC 
CCCGGCATCG ACACCCTCAA TCTGCCACGC GAGGTCACGG ATCCCTGGAA GGAACGGCTG 
CGTTTTCCCC AGAACGGCGG CAGCCGCCCG ACCCGGCAAC GACACATCGA CACCCTGATC 
ACGGTCCGCG CCTTCTACCT CGACATCGCC GAATGGGCAC TGTCGGACCC TTCCTGGGCG 
CCTTGGGCGT TCCCCAGCCC GGTGCGCAAG AGCGACACCG CGGGAGTCGT CAAACAGCGC 
CGCGCCACAA CGGCCTCGAA CTCGGCGACT GCGGACGCCC CTACGGCACC CCCTGCATCC 
ACGAACACGC CTGCGTCCGC TGCCCCATGC TCCGCGTCGA CCCCCGCCAA CGCACCCGCC 
TCGAACAGAT CATCCGCAAC CTCGGCGAAC GCATCGAGGA AGCCAAAGCC AACGGCTGGC 
AGGGCGAAGT CGAGGGCCTC AAGACCAGCC TCGAAGCCGC ACAGCGCAAG CTCGCCGGCC 
TGGACCGCGC AGCCCGCAAC ACCTCCAAAC CAGCACCACT CGGAATGCCA CCAATCCCAC 
CCAAAATTTC AAGATCAAAA TCCGGATAAG CGGGTGCCTG GGATATCCCG CGAGCTTGGT 
GGGTGCAGCT GGCCGAGGAC GGGCGTCTGG TGGTGCCGCT GCGGATCCTC GGGCTGA

Protein sequence

MPTAVAAPAT KQAIGPGASG WEPAARPVGP WDTASLDDVL AAVPTLSWWN AKRQQAQRSV 
AGVELLLDWL GRVPGGWQDR WEHAEAMLGP RWATWSAAIP EPDRPCGERH RVVLTRGLAC 
LLRMRLVRPS YPFLTTYGPT TTFAVVRDLV SPELFACAAD AARACGGHSE NVLRKALNVL 
TAIVIHTGGS LNEVTTGDLL AFQSATAPSR GRTRDGSHLA WQMMVDLGVF PPHSTLHAAM 
RTGPQSTAEL VDRHGIADRQ IRELLIRYLD ERRPALDYST FRMLVGRLAG AFWADLERHH 
PGIDTLNLPR EVTDPWKERL RFPQNGGSRP TRQRHIDTLI TVRAFYLDIA EWALSDPSWA 
PWAFPSPVRK SDTAGVVKQR RATTASNSAT ADAPTAPPAS TNTPASAAPC SASTPANAPA 
SNRSSATSAN ASRKPKPTAG RAKSRASRPA SKPHSASSPA WTAQPATPPN QHHSECHQSH 
PKFQDQNPDK RVPGISRELG GCSWPRTGVW WCRCGSSG