Gene Francci3_2698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2698
Symbol
ID	3904922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3183091
End bp	3184635
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	73%
IMG OID	637880022
Product	hypothetical protein
Protein accession	YP_481788
Protein GI	86741388
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.570232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGCGGG TGGCGCGGGT GAGTCTGCGG GTGGAGCAGA ACGAGTTGCG TGCGCGGATG 
CGGGCGGCCG GGATGACGCA CGAGGAAGCC GCGGTCGAGT TCGCCCGCCG CTACCGGCTC 
CGCCCTCGGG CGGCGTTCCG GCATGCGTTC GGATGGACGT TGCAGGAAGC CGCCAACCAG 
ATCAACACTC ATGCCACCCG TACCGGCTTC GATCCAGATG GCATACCGGT GATGACCGCT 
CCGCGGTTGA GCGAGGTGGA GAACTGGCCG CGCCCCGACC GGCGACGGCT AACTCCGCAG 
GTGCTCGCGC TACTCGCCGT TGTGTACGGC ACCGATGTTC ATCGCCTCCT CGATCTTGAG 
GATCGGGAGC GGCTGAGCCC GCAGGACCGG CTCCTCCTCC ATCGCATGCA GCGGAACACG 
GTGGATTCCG CGCCTCGGGG GCGCAGGAGC ACGCAGTCTG CCGGGACTGT GGGGGCGGTT 
CGGACCCGGC CGATGGCCTA CGACCTTTTC CGCCACGAGC AGGGCAACCG CGGCGCGCCA 
CAGCCCATGG CCTCCGCCGG AGAGACCGGG TTTCTCGACG GTGACGAGCA GGAGCGGCTA 
CGCCGTGCGG TGTCGCGGCC GAGCCGTGTG GATGGTCGGG TGGTGGCGTC GTTGGCGGCG 
ATCCTGGCCG AGCAGCGGGC GACCGAGGAC CTGATCGGTT CGGCCCGGCT ACTGGTCCCG 
GTCATGGCGC AGTTGGGTGA GGTGGAGCGG CTGATCGGCG AGGCGTCGGG GCAGGTGCGG 
GGGCCGCTGG TGGAGATCGG GGCGCAGTGG GCGGAGTTCG CCGGCTGGCT GCACATCTCC 
ACCGGCCGGT GGGCGGCGGC CCGTGGCTGG CTGGACCGGG CCGCGGAGTG GGCGTTCGAG 
GTGGACGCGA CCACCCTGCA CGCGACCACA ATCAGCTTCA AGGGTCATCT GGCGTTCCAC 
CTCGGCCAGC TCGACGCCGC GGTGGGCCTG TCGCGGGCGG CGTCGCGGGA CGAGCGGGTG 
TGGGTGGGCC AGCGGGCCTA CGACGCCCAC CAGGAAGCCC GCGCCCACGC GCTCGCGGGC 
CGCCGCCGGC CGGCGGTCGA GGCGCTGGCT CGGGGCGCCG ATCTCGCTGC CGCCGCAGCG 
GCGGACGGCG AGGCGGCCCC GGCGTGGATC TACTACTACA CGCCGGAGTT CTACGCGTTG 
GAACGCGGCT GGGTCTGCCG CTACCTCGGC CGCGACGACC CGGCCTCCAA CGAGGAGGCG 
ATCGCCTGCC TCACCCGCGG ACTCGCCGGC CTCGGCGACG CCCGCACCTC CGGCTGGGCG 
GCGGAGTTCC TCTGCCACCT AGCCGCCGCC TACCTCCAGG CCGACAGCCC CGACCTCGCC 
GGCACAGCCG GTATCGAGGC GGCGACGATC ATCGCCGCGA CGGGGTCCGT CCGGCTTCTG 
CCACGGCTGC GGCGGTTGCA CGCCGACCTG GCCGCACGCT GGCCGACAAG CCCCACCACA 
GCTGATCTGG GTGAGGCCCT TCGGCTCGGC CGGGACGACG GGTAG

Protein sequence

MGRVARVSLR VEQNELRARM RAAGMTHEEA AVEFARRYRL RPRAAFRHAF GWTLQEAANQ 
INTHATRTGF DPDGIPVMTA PRLSEVENWP RPDRRRLTPQ VLALLAVVYG TDVHRLLDLE 
DRERLSPQDR LLLHRMQRNT VDSAPRGRRS TQSAGTVGAV RTRPMAYDLF RHEQGNRGAP 
QPMASAGETG FLDGDEQERL RRAVSRPSRV DGRVVASLAA ILAEQRATED LIGSARLLVP 
VMAQLGEVER LIGEASGQVR GPLVEIGAQW AEFAGWLHIS TGRWAAARGW LDRAAEWAFE 
VDATTLHATT ISFKGHLAFH LGQLDAAVGL SRAASRDERV WVGQRAYDAH QEARAHALAG 
RRRPAVEALA RGADLAAAAA ADGEAAPAWI YYYTPEFYAL ERGWVCRYLG RDDPASNEEA 
IACLTRGLAG LGDARTSGWA AEFLCHLAAA YLQADSPDLA GTAGIEAATI IAATGSVRLL 
PRLRRLHADL AARWPTSPTT ADLGEALRLG RDDG