Gene Francci3_0466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0466
Symbol
ID	3903197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	545444
End bp	546793
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	72%
IMG OID	637877797
Product	tetratricopeptide TPR_2
Protein accession	YP_479581
Protein GI	86739181
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.924549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.198291
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACGG ATAACGCTCA TGCCTGCACT CATCCGCTTG CGTTCATCCG AGCCCAGCGC 
GGGTGGTCCT ACCAGCGTCT GGCGCGGGTC GTGGCCCGCC GCGCACGTGA CCTCGGGGTG 
GCGAACATGG CCGCCGAGCG GCAGAAGGTC TGGCGCTGGG AGCACCGTGG GGTCGTGCCC 
GACCGGGTGT CCCAGCTCGC GCTCGCCGCG GAGCTCGGCG TGCCCAACGA TCGCCTGGAG 
TCGCACCCCT GGCCCGCGTG GCTACCGACC GGCGACGCGG TGCGCACCGA GTACCCGTGG 
ACGCCGGGTG GCAGCATAAC CTCGATCATG GACGTCGTCG AGGACGCGCT CTCCGACCGC 
CGCGGCTTCC TGACGATCAC TGGGACCGGG GTGGCGGAAC TCGCGACGCA GTGGCTCGGC 
ATGGAACCGG CCCGGCTGGC GGCGGCCCTG AACGGGGGAC GGGTCGACGA CCAGATCGTG 
AACCGGATCG AGCACAACAT CCCCGGGCTA CGGGTCATGG ATGAGCGGCT CGGTGGGGAG 
AGCGTGCGCC GGCTGGTCGA CGCCGAGCTC GGCGTGGTGG CGGACCTGCT GGCGCGCGGA 
TCCTATACCG AGCACGTGGG CCGTCACCTG CATCTGGTGG CCGCGGAGCT CGCCCGGTTC 
GCGGGATGGG TCTCGTTCGA CGCCGGCTTC CAGACGGCCG CCCAGCGGTA CTGGATCACC 
GCGCTGCATG CCGCGCACGC CGGCGGGGAC CGCATGCTCG GTGCGAACGT GCTGAAGAAC 
ATGTCCCTGC AATGCGTGGA CTTCGCCCGC CCACGGGAGG CGGTGGATCT GGCCGAGGCC 
GCCGTGGCCA GCGCCGGGGG GGCGTCCGGT CGCGTCGGCG CCATGCTGCA CATGCGGCGG 
GCCCGTGCCC ATGCCGCGCT CGGGGAGGCC AGCGCCTGCG CGCAGGCGCT GGCCTGCTCG 
GAGGAAGCGA TGGTCACCGC GCGGCCTGAG GAGCCCGCCT GGTCGTCCTA CTTCGACGAG 
GCCGAGTACC AGGCGCAGAT CGGCAGCTGC TACATCGATC TCGGTCACCT CGCGCAGGCG 
GACCGGTGGC TGGAACGCTC CCTGGCGATC CAGCCGGACT CCCGGGCCCG GGACCGGGCC 
ACCTACCTGC TTCGGTGGGC CGCGGTCCAG ATGGATCTCG GTAACGTCGA TCACGGGTGC 
GAGCTGACCC GCCAGGCCCT GCCGATGCTG GCGGCGACGC GATCCAAGCG CAACGCCCGC 
CGGGCCGACG AGCTGCGCCG CCGGCTGCGG CGGCACGGCA CCGACCCGGC GGTGCGGGAA 
CTCGATCAGA TCCTCGCCCG GACTGTCTGA

Protein sequence

MLTDNAHACT HPLAFIRAQR GWSYQRLARV VARRARDLGV ANMAAERQKV WRWEHRGVVP 
DRVSQLALAA ELGVPNDRLE SHPWPAWLPT GDAVRTEYPW TPGGSITSIM DVVEDALSDR 
RGFLTITGTG VAELATQWLG MEPARLAAAL NGGRVDDQIV NRIEHNIPGL RVMDERLGGE 
SVRRLVDAEL GVVADLLARG SYTEHVGRHL HLVAAELARF AGWVSFDAGF QTAAQRYWIT 
ALHAAHAGGD RMLGANVLKN MSLQCVDFAR PREAVDLAEA AVASAGGASG RVGAMLHMRR 
ARAHAALGEA SACAQALACS EEAMVTARPE EPAWSSYFDE AEYQAQIGSC YIDLGHLAQA 
DRWLERSLAI QPDSRARDRA TYLLRWAAVQ MDLGNVDHGC ELTRQALPML AATRSKRNAR 
RADELRRRLR RHGTDPAVRE LDQILARTV