Gene Francci3_3165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3165
Symbol
ID	3903887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3744206
End bp	3745537
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	73%
IMG OID	637880486
Product	hypothetical protein
Protein accession	YP_482251
Protein GI	86741851
COG category	[S] Function unknown
COG ID	[COG4198] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0143624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.30892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCTCA TGGTTGACGC CGATCGTCCC GTTCCCGCTC CGGCGGGTCT CGTGCTCGCC 
CCGTTCCGGG CCGCACGATT TCCGTCCTCC GGGCCGGACC TCGCCCCGCT GACCTCCCCG 
CCCTACGACG TCATCGACGA CGCCGAACGG GCGGAGCTCC AAGCGCGCGA CGAGCGCAAC 
GTGGTCCGGC TCATCCTCCC CGGGGAGGAC TACGACGGGG CCGCCCGCAC GCTGCGGGCA 
TGGCTGGACA GCGGAGTGCT GCGTCGCGAC GAGAAGGCCT CCGTCTACGT CTACGAGGAG 
GAGCGGGCCG GCCACGCCCA GCGCGGGCTG ATCGGGGCGG TCGCGCTGAC CGATCCGGAT 
GCGGGGATCA TCCTCCCGCA CGAGAACACC ATGGCGGGCC CGGTCTCAGA CCGGTTGGCG 
CTGACCCGCG CGACCCGCGC GAACCTGGAA CCGATCTTCC TGCTCTACGC CGGCGGCGGC 
GAGACCAGCC GGGTGGTCTC GATGGTGATC GCCACGACGC CGCTGGTGGA GACGTCCACG 
GACGACGGGG TGACGCACCG GCTCTGGGCC ATCGACGATC CGGCGGTCCT CACCGCCATC 
GCCGCGGACC TGTTGCCCCG GCGCGCGGTG ATCGCGGACG GCCACCATCG GTACGCCACC 
TACCGCCAGT ACCAGGCGGA ACGGCACGCC GCCGGGGATG GTTCGGGCCC CTGGGACTTC 
GGTCTGGCCT TCCTCGTCGA CGCGACCGTC TCGGGGCCCC AGGTGCACGC CATCCACCGG 
GTAGTGCGTG GTCTCGGGCT CACCGAGGCG GTGCGGCGGG CCGCCGAGGT GTTCACCGTG 
CGTCAGCTCG CCGGGCCCGG CGAGGGTGGT ACCGCCGCCG GGGATGCCGG TGGCGTGGGG 
CCGGCAGGCG CGGACCCGGA CGCGCTGGTG GAGGAACTGG CCAAGGCCGG GCAGGGCGGG 
CACGCGTTCG TGGTCACCAA CGGCACCGCG GCCTACCTGC TCACCGAGCC CGACGCCGAC 
CTGCTCACCC GTAGTCTGCC CCCCGAACGG TCGGCGGCCT TCCGTGGACT CGACGTCACC 
GTCGCTCATC TTGCGTTGAT CGTGGACGTC TGGGGGTTGA CGGACACGGT GGGCGTGGTC 
GACTACCACC ACGACGCGCC GGCCGCGATC GCCGCGGCGG CTGCGGCGGG AGGTACCGCG 
CTGCTGCTCA ACCCCACCCC GATCGCCGGT GTGACGGCCG TCGCCGAGGC CGGCGAGCGG 
ATGCCGCGCA AGTCGACGTT GTTCACCCCG AAGCCGCGCA CCGGACTCGT GCTGCGTCCA 
CTCGACGACT GA

Protein sequence

MRLMVDADRP VPAPAGLVLA PFRAARFPSS GPDLAPLTSP PYDVIDDAER AELQARDERN 
VVRLILPGED YDGAARTLRA WLDSGVLRRD EKASVYVYEE ERAGHAQRGL IGAVALTDPD 
AGIILPHENT MAGPVSDRLA LTRATRANLE PIFLLYAGGG ETSRVVSMVI ATTPLVETST 
DDGVTHRLWA IDDPAVLTAI AADLLPRRAV IADGHHRYAT YRQYQAERHA AGDGSGPWDF 
GLAFLVDATV SGPQVHAIHR VVRGLGLTEA VRRAAEVFTV RQLAGPGEGG TAAGDAGGVG 
PAGADPDALV EELAKAGQGG HAFVVTNGTA AYLLTEPDAD LLTRSLPPER SAAFRGLDVT 
VAHLALIVDV WGLTDTVGVV DYHHDAPAAI AAAAAAGGTA LLLNPTPIAG VTAVAEAGER 
MPRKSTLFTP KPRTGLVLRP LDD