Gene Francci3_3062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3062
Symbol
ID	3904263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3631548
End bp	3633317
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	73%
IMG OID	637880383
Product	hypothetical protein
Protein accession	YP_482148
Protein GI	86741748
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.319851
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCC TGGGCAGAAT GGTCGTCTCG GGCAGACGCC GCTTTCCACC GCTGCCCGGT 
GACGCCGCGC CCGTCTCCCT ATGCGATCCC GCTGTCTTCG GGGATGACCC CGCCTCCGGG 
AATGACCCCG CGGATGACCT CGCCGCCCCG GGCCGGGTGC CGTCCGGGGA GCACCCCGGC 
CCGCTCTACG GCCCGAACGC GCGGCGCCGT GAATCGGGTC CGGCCTCCGC CCAGCCGGCC 
CGACCCGCCC AGCCGGCCCG ACCCGCCCGG CCGGTCGCGC GGCATCTGCC CTTCGCGGTT 
CTCCTGGTCG CCGGGATGAC CCTGCGGGTG GTCACCGGGT ACGCCTACCG GCCGGCGTTC 
GAGTTCAGCG GAGACTCCTA CGCCTACCTG CGACTTTCCA CCCTGCACGC GCCCGACCCG 
ATGCGGCCGG CCGGATACCC GGCCTTCCTG CGCCTGCTGT CGCACACCGG CGACCTGTGG 
TGGGTGACGG TGGTCCAGCA CGTCGCGGGC CTGGCGCTCG GGGTGGGGAT CTACGTCCTG 
CTGGTCCACC GCCGAGTGGC GGCCCCGGTG GCGGCCCTCG CCGCCGCGCC GGTCCTGCTG 
GACGCCTACC AGCTGGTCCT CGAGCACTAC GTGATGGCCG AGACCCTGTT CGCGGTCCTG 
CTGGTCGCCG CGATGATCGC CCTGACCTGG TCGGCACGAC CGTCGGTGTG GGCGTGCGGG 
CTCGCCGGCC TGTTACTGGG CGGGGCGGGC CTGGTCCGCA CCATCGGGGT CGCCATGGGT 
GTGCTCGCCG TGGGCTACCT GCTTCTTCGT CGCGTCGGAT GGCTCCGGCC CGCCGCCTTC 
GCCGTGATGC TCGCCGTTCC ACTCGTCGGA TACGCGGGCT GGTTCCACCA CGCGCACGGG 
AAGTACGCGC TCACCGGTGG GGACGCGGTG TGGATGTACG GCCGGGTGGC ACCGATCGCC 
GAATGTGATC GCCTACACCT GAGCACGCGC CAGCTCGTCC TGTGCTCCCC GCATCCGGTG 
GCGGGGCGGC CCGATCCCAG CTACTACGTC TGGAACGGCA ACAGCCCGCA CTGGCGGCTC 
GACATGCCCG ACGACAAGCG GGACGCGCTG CTGCGCGACT TCACCCGCCA GGTCATCCGG 
TATCAGTTCG GTGACTACGC CCGGATGGTC GGCGGGGAGA TCGCGCACTA CTTCGCCCCG 
GGCCGACCGG TCGGGCACCG TGACTGGCCG GACGCGACCT GGCGGTTCCC GACCGGTAAC 
GAACCGCGCT ACCTACACAA CGGCGAGCCA CTGCTCGGCT TCCACGGGGA CGCGCCCAGC 
CGCGTCATCC GCGAGCCGTC CGCCGGTTTC CTGCGGAGCT ACCAGCATCT CGTCTTCACG 
CCCGGTCCGG CCCTGGCCGG GATGGTGATC CTTGCCGTCG TCGCGATCAT GATCCCGGGA 
CGGGACCGCC GTGCGCCGCC GGGGAACCGT GGCTCCCGGC GCCGGAGAGG CCTGCGGGAC 
CGGGCCGCCG AAGATCGACG GCTGCGGGCG GACATGGCCC TCCTCGTGGC GGCCGGGGCC 
GCCACGCTCA TCGTCCCGGC CGCGACGGTG TGCTTCGACT ACCGCTACCT GCTCCCCGTC 
CTCGTGCTCT TCCCGCCTGC CGCCGCGCTC GCGACCCGCC GGTTCGTGCT GCTCAATCGA 
TCGCGCCGGG CGCCCGCGGA GGAGCCGGGG ATCAACGGCT CCAGCCGAGC CCCAGCCGGG 
GTGCCTCCAT CGCCGGGCAG GTGTCCATGA

Protein sequence

MAVLGRMVVS GRRRFPPLPG DAAPVSLCDP AVFGDDPASG NDPADDLAAP GRVPSGEHPG 
PLYGPNARRR ESGPASAQPA RPAQPARPAR PVARHLPFAV LLVAGMTLRV VTGYAYRPAF 
EFSGDSYAYL RLSTLHAPDP MRPAGYPAFL RLLSHTGDLW WVTVVQHVAG LALGVGIYVL 
LVHRRVAAPV AALAAAPVLL DAYQLVLEHY VMAETLFAVL LVAAMIALTW SARPSVWACG 
LAGLLLGGAG LVRTIGVAMG VLAVGYLLLR RVGWLRPAAF AVMLAVPLVG YAGWFHHAHG 
KYALTGGDAV WMYGRVAPIA ECDRLHLSTR QLVLCSPHPV AGRPDPSYYV WNGNSPHWRL 
DMPDDKRDAL LRDFTRQVIR YQFGDYARMV GGEIAHYFAP GRPVGHRDWP DATWRFPTGN 
EPRYLHNGEP LLGFHGDAPS RVIREPSAGF LRSYQHLVFT PGPALAGMVI LAVVAIMIPG 
RDRRAPPGNR GSRRRRGLRD RAAEDRRLRA DMALLVAAGA ATLIVPAATV CFDYRYLLPV 
LVLFPPAAAL ATRRFVLLNR SRRAPAEEPG INGSSRAPAG VPPSPGRCP