Gene Francci3_3836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3836
Symbol
ID	3905584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4597379
End bp	4599106
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	74%
IMG OID	637881162
Product	leucyl aminopeptidase
Protein accession	YP_482915
Protein GI	86742515
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0130732
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCG TTGATTCCGC GTCAGGCCCG GCGATCGACG GGCTCATCAG GCTTCCTCCC 
GGCGTTACCC TACGGTCCGC CACCGTCGCC GACGTCGAGC CCTCGACCGT CGCCCTGGTC 
CTCGCGTCGT CCGAGAACGG ACCCGTGTTC GACGAAACTG CCCGCGGTGT CGGCGCCGAT 
CTCGGACTGG ATCTTGCGCT GCTGGTCGAG TCCGAGTCCC TGCGCGGCGA TGCGGGTTCG 
GTGCTGGTGG TGCCGTTGGC CCGGACGGCT CGGCCGACCC GGCTGCTCGT GGTCGGCATC 
GGCGCCGGTC AACCGGGTGA CTGGCGGGCC GCGGGCGCCG CGCTCGCCCG CCGCGCCGGG 
GCACCGGACC GGCTCGCGGT GGTGGCGGAG CCCGGCGATC CGGGCCTGCG GGCCTTCACC 
GAAGGCCTGG CGCTAGGCGC CTACCGGGCC GCTGGAGTGC TCGACCGGGC CGCTGGAGTG 
CCCGACCCGG CCGGCCGGCC CGGGCCGGAG AACGGCGCGC CCGGCAACGT CATCGTGCTC 
ACCGGTCGGG CGGACGAGCC CGGGGCGGTG GCCGCGGTCG GCGCCGCGCG GGCGGTGGCC 
ACCGGGGTGT ACATCGCCCG CGATCTGGTC AACATGCCGA GTCTGGTGAA GTCACCCGAG 
TGGCTGGCGA ACCGTGCCGT GCGCATCGCC GCGTCGGCGG GTCTCGACAC GACCCTGCTC 
GGCCCCGACG ATCTTTCGGC GCAGGGCTTC GGGGGGTTGT GCGCCGTCGG TGAGGGTTCC 
CCGCGGCCGC CCTACCTGGT CAAACTCGAA TATCACGGGC CACCGTGGAC TTCTGGCGAG 
GCCGGGTTGG CGGGATCCAC CGGGTCGGCG GGATCCACCG GGTCGGCGGG ATCCACCGGG 
TCGGCGGGAT CCATCGGGTC GGCGGGATCC ATCGGGTCGG CGGAGCCGGA TGGTTCGCCG 
GCGGGCCGCT TCACCGATGG TCACCGGGTC CTGGTCGGGA AGGGAATCAC CTTCGACTCG 
GGTGGGCTCT CCCTGAAGCC GGCCGTCCCG ATGGCCGGCA TGAAGACCGA CATGGCGGGC 
GCGGCGGCGG TGCTCGGGGC GATGACCGCG TTGCCGGCGT TGAACGTGCC CGGGCGCGTC 
ACCGGCCTGC TCTGTCTGGC GGAGAACATG ATCGGTGCGA CTGCCATGCG TCCCGGCGAC 
GTCATCACCT GCTGGGGCGG GACCACGGTG GAGGTACTGA ACACCGACGC CGAGGGCCGC 
CTGGTGCTGG CGGACGGCCT CGCCTACGCC GCGGGCGCGC TCGACGCGGA TGTCATCGTC 
GATCTCGCCA CGCTGACCGG AGCGATCGCC GTGGCGCTCG GCCGGCGCAC CGCCGGGCTG 
TTCAGCTCGG ACGACCGGCT GGCGGCGGCG CTGTCCGCCG CGGCGGACAG CGCCGGGGAA 
CGGGTGTGGC GGCTGCCGTT GGTGAAGGAG TACCGGGCGG CGATCGACTC GCCGGTGGCG 
GACCTTGCCA ACATCGGCCG GGCGCTGGAC GTCGGGGGCG GTTCCATCAC CGCGGCGCTG 
TTCCTGCGGG AGTTCGCGGG CCGGCGGCCC TGGGCACATC TGGACATCGC GGGCACCGCA 
CGGTCGGACG CCGACGACGG CGAGATCAGC CGGGGCGGCA CCGGGTGGGG GGTGCGTACC 
CTGCTGACCT GGCTGTCGAG TGGGCCATCC CAGACACCGG CGGCCTGA

Protein sequence

MSIVDSASGP AIDGLIRLPP GVTLRSATVA DVEPSTVALV LASSENGPVF DETARGVGAD 
LGLDLALLVE SESLRGDAGS VLVVPLARTA RPTRLLVVGI GAGQPGDWRA AGAALARRAG 
APDRLAVVAE PGDPGLRAFT EGLALGAYRA AGVLDRAAGV PDPAGRPGPE NGAPGNVIVL 
TGRADEPGAV AAVGAARAVA TGVYIARDLV NMPSLVKSPE WLANRAVRIA ASAGLDTTLL 
GPDDLSAQGF GGLCAVGEGS PRPPYLVKLE YHGPPWTSGE AGLAGSTGSA GSTGSAGSTG 
SAGSIGSAGS IGSAEPDGSP AGRFTDGHRV LVGKGITFDS GGLSLKPAVP MAGMKTDMAG 
AAAVLGAMTA LPALNVPGRV TGLLCLAENM IGATAMRPGD VITCWGGTTV EVLNTDAEGR 
LVLADGLAYA AGALDADVIV DLATLTGAIA VALGRRTAGL FSSDDRLAAA LSAAADSAGE 
RVWRLPLVKE YRAAIDSPVA DLANIGRALD VGGGSITAAL FLREFAGRRP WAHLDIAGTA 
RSDADDGEIS RGGTGWGVRT LLTWLSSGPS QTPAA