Gene Francci3_3574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3574
Symbol
ID	3904513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4272113
End bp	4273297
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	66%
IMG OID	637880895
Product	peptidase M50
Protein accession	YP_482655
Protein GI	86742255
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCTTC TCGGCATTGC GGCGTTCGCA CTGGCCCTGC TGGTGTCGGT CGTCGCGCAC 
GAGGCCGGGC ATTTCGTGAC GGCCCGGCAC TACGGCATGA AGGCCTCCAA GTTCTTCGTC 
GGTTTCGGGC CGACCATCTG GTCCCGGCGG CGGGGGGAGA CCGAGTACGG TGTCAAGGCC 
ATTCCGGCCG GCGGTTTCGT CAAGATCGAG GGGATGACTC CGCTCGAGGA GATCGATCCG 
GCCGATGAAC CCCGCGCCTT CCACAATGCG CGGGCGCGGG CCCGGCTCGT GGTCATGTCG 
GCCGGTTCCT TCGTGCATTT CGTCATCGCC ATCGTGCTGG TCTACGGAGT GCTCGTTGTC 
CTGGGCACGA CCACGATCAG CGAGTCGAGG GTCGGCGCGA CGAGTTGCAT CGCCACGACC 
GCGACTTGTT CCGGACCGGG GCCGGCCGCG GCGGCCGGTC TGCGGCCGGG TGACCGGATC 
GTCAGCTTCG GCGGAGTTCC GGTCACGACC TGGACGCAGT TCACCCGGCA GGTGCGTGCG 
CACGGAGCGG GGCCTGCGGT GATGGTCGTC GAACGGGACG GCCGCACCCT CACTCTCACG 
CCGAACCTGG TGGAGGTCCG GCGCGATCGG GAGACCGGGC AGGCGGGCGA CGACCGGGTC 
GGCGCCTTGG GCGTCAAACC GGGAACCGAG ACAGTGCACT ACAACCCGAT CGAAGCGGTG 
CCCCGCACCT TCGATGTCAT CGGGTCCGGG TTCACCGGCA TGTACGAAAC GCTGACCCGC 
CGGATCGGTG ATATCGGTAA TATCTTCAGC GACAACCGCG ACCCCCAGGG TTTCATCAGC 
GTGGTGGGAG CGGCGCGTAT CGGCGGTGAC GTGGTCTCGG CCGAGGGCAG TTCGGCCGTG 
GACCGGGTGC GGAACCTTCT CATTCTGGTC GCCGCGATCA ATCTCGCGGT CGGAATTTTT 
AACCTGTTGC CCCTACTCCC GTTGGACGGC GGTCATATTG CCGTGCTGGG CTTCGAGCAG 
GCCCGGCACG GTCTACGCAG GCTCCGGGGT TATCGCGGTC CGGTGCAGAA GGTGGATTTC 
GCCAAACTGT TACCAGCCAC GTACGCCACG GTCGTCGTAT TGCTCGGGTT CAGTCTGCTT 
GTCCTGTCCG CCGACATCGT CAATCCCATT CGCCTGAATC AGTAA

Protein sequence

MELLGIAAFA LALLVSVVAH EAGHFVTARH YGMKASKFFV GFGPTIWSRR RGETEYGVKA 
IPAGGFVKIE GMTPLEEIDP ADEPRAFHNA RARARLVVMS AGSFVHFVIA IVLVYGVLVV 
LGTTTISESR VGATSCIATT ATCSGPGPAA AAGLRPGDRI VSFGGVPVTT WTQFTRQVRA 
HGAGPAVMVV ERDGRTLTLT PNLVEVRRDR ETGQAGDDRV GALGVKPGTE TVHYNPIEAV 
PRTFDVIGSG FTGMYETLTR RIGDIGNIFS DNRDPQGFIS VVGAARIGGD VVSAEGSSAV 
DRVRNLLILV AAINLAVGIF NLLPLLPLDG GHIAVLGFEQ ARHGLRRLRG YRGPVQKVDF 
AKLLPATYAT VVVLLGFSLL VLSADIVNPI RLNQ