Gene Francci3_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3422
Symbol
ID	3905662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4069394
End bp	4070560
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	71%
IMG OID	637880745
Product	twin-arginine translocation pathway signal
Protein accession	YP_482505
Protein GI	86742105
COG category	[S] Function unknown
COG ID	[COG5563] Predicted integral membrane proteins containing uncharacterized repeats
TIGRFAM ID	[TIGR02913] probable extracellular repeat, HAF family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGAACA ACCGGAGAAC ATTCGTCCAC CTAGCGGTCA TGGCCGCAGC CGCCGCACCG 
TTGTCCCTCA CCGGGCTTCC CCCGGCCCTG GCGGCGCCGG TTCCAGAACC ACGACCTGAC 
CCACGCCAGA CGACGCCGGC CGGGGTCGGC ATTCCCGGAC CGGGCAGTCC CGGCTCGCTG 
ACCAGTGGCA ACAGCCGCGG ACTCTACGTT GGTCACTGGG ACAGCGGCGC GTACAGCACC 
ACGGGCTTCC TTTGGCGCGA CGGCACCGTG CATGTCCTCA ACGGCAGCAC AGAGCCGAAG 
GCGGTGACCG AGGACGGCTT GGTCATCGGC GATTTCGTCA GCCACTACGA CCGGCAGGCG 
TTCCGGCTGG AACACGGAAC CTCCCAGCCC CAGGGTCTGG GCTACCTCGG CGGCACCCAC 
ACGGCCGGCG GCTACAGCAG CGCCGCGGTG GCGGTCAACC GCGCCGGGGT CATCGTCGGC 
ACCAGCACCA CCAACGCCGG TACGTTCCAT GCCTTCCGGT GGGCGGACAA CCACCTGCAG 
GACCTGGGTA CGCTCGGCGG CCCGAGCAGC TCCGCCGTCG CGGTCACCAG CGCCGGGGCC 
ATCGCCGGCA GCAGTAACAC CGCCGCCGGC CCGTCCCACG CCTTCCGCTG GTGGAGAGGC 
ACCCTGCACG ACCTGGGTAC CCTCGGCGGC CCGTCAAGCA CCGCGGTGGC CGCGAACGAC 
GCCGGGCAGA TCGTGGGCTA CAGCGACACG GCCGACGGGC ACACCCACGC CTTCCTCTGG 
GAACGCGGTC GTCTGATCGA CCTCGGTACG CCGCCCGGCG ACACCGAATC CTGGGCGATC 
GGGATCAACA ACGCCGGCCA GGTCCTCGTC CTGAGCCGCG GCTCGTCGAA CCATGCATTC 
GTCTGGTGGC ACGGCCAGCG CGCGACCATC AGCGTGCCCA GCGGCGACTT TGGGGTGACC 
GCCATCAACG ACCGGGGAAC CGTCGCCGGC ACGGCGAACG GGCACGCGTT CCGTTGGCGC 
GACGGCCGTT TCACCGATCT CGGCACGCTG GGCGGGCCGT ACAGCGACGC GAACGCCATC 
ACCCCCGCCG ACGTCGTCCT CGGTTCCTCG GACCCGGCCG ACTCCCCGAT TCCGCTCGCG 
ACCTTCTGGC CGGCCCCCGG CCGCTGA

Protein sequence

MPNNRRTFVH LAVMAAAAAP LSLTGLPPAL AAPVPEPRPD PRQTTPAGVG IPGPGSPGSL 
TSGNSRGLYV GHWDSGAYST TGFLWRDGTV HVLNGSTEPK AVTEDGLVIG DFVSHYDRQA 
FRLEHGTSQP QGLGYLGGTH TAGGYSSAAV AVNRAGVIVG TSTTNAGTFH AFRWADNHLQ 
DLGTLGGPSS SAVAVTSAGA IAGSSNTAAG PSHAFRWWRG TLHDLGTLGG PSSTAVAAND 
AGQIVGYSDT ADGHTHAFLW ERGRLIDLGT PPGDTESWAI GINNAGQVLV LSRGSSNHAF 
VWWHGQRATI SVPSGDFGVT AINDRGTVAG TANGHAFRWR DGRFTDLGTL GGPYSDANAI 
TPADVVLGSS DPADSPIPLA TFWPAPGR