Gene Francci3_0694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0694
Symbol
ID	3906244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	794611
End bp	795855
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	69%
IMG OID	637878027
Product	peptidase M20D, amidohydrolase
Protein accession	YP_479807
Protein GI	86739407
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.887373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGCAGGG AGGAGCCCGG CCGGCAGATG AAGGTTGACG AGACCGCGGC GGTCGCCGGG 
TGGGTGGCCG CGCACGAATC CGAGCTGATC GCGTTGCGTC GCGATCTCCA CGCTCACCCG 
GAGCTCGGCC GGCAGGAGCA CCGCACCGCC GAGCAGGTCG AGGCGCGGCT TCGGGCCGCG 
GGACTGTCGC CGCAGCGCCT GCCGGACCTT CCTGGCCTGT GGTGTGACAT CGGTGCCGGC 
GTCGATCATG ATCCAGGCGC TCCCGTGATC ATGCTGCGGG CCGACATGGA CGCTCTTCCG 
CTCTCGGATA TCAAGGACGT GCCGTACCGC TCCACCGTTC CGGGTGTGGC TCACGCCTGC 
GGACATGACG TACACACGAC CGTGGCGCTC GGCGCCGGAC TCGCGCTTGC CGAGGTCGCA 
CGCGTGTCCA CGCTGCCCGG GACCGTGCGC CTGGTGTTCC AGCCCGCGGA GGAGCTCATG 
CCGGGCGGCG CGTTGGACAT CATCGACGCG GGCGTGCTGA AGCCGGTGAC CACGGCGATC 
GCGCTGCACT GCGATCCGGC GCTCGACCTG GGCATGATCG GTCTGCGGAC GGGTCCGATC 
ACCTCTGCCG CCGATGCCGT CGAAATCACG CTGGCCGGGC CCGGCGGTCA CACCTCCCGG 
CCACAGAACA CAGTCGACCT GGTGTACGCG CTCGTCCGCC TTGCGGCCGA TCTCCCTGCC 
GCGTTGGGGC GACTGGTCGA TCCCAGGTCG GCGCTCTCCC TGGTCTGGGG TCAGGTGCAG 
GCGGGAACCG TTGCCAACGC CATCCCTCGT ACCGGTCAGC TTCGAGGCAC GGTCCGCACC 
CTGTCCCGGG AGACCTGGGA GAGCGTGCCG GCGCTGGTCA CTCAGGTTGC CGAGCAGCTC 
GTCGCACCGT ACGGAGCACA GATCGTGGTC GACTACCGCC GTGGCGTGCC GCCCGTGGTG 
AACAGCGTGG ATGTCGTCGA GGTCCTTCGG ACCGTCGTCG ACCGCGTGTT TGGTCATGGG 
GCCTCCACCA TGGTGGCGCA ATCGCTTGGT GGTGAGGACT TCGGTTGGTA TCTGAACCAC 
GTGCCGGGGG CCTTGGCCCG ATTGGGCACT CGGACACCCG GCGGCCACAC CTACGACCTT 
CACCAGGGCA GCTTCGACGT GGACGAGAGG GCGATCGGTG TGGGCGTGAA GCTGCTTGCC 
GGCGCGGCTC TCGATCTGCT GACCCATACG CCCCCGGCGC CGTGA

Protein sequence

MCREEPGRQM KVDETAAVAG WVAAHESELI ALRRDLHAHP ELGRQEHRTA EQVEARLRAA 
GLSPQRLPDL PGLWCDIGAG VDHDPGAPVI MLRADMDALP LSDIKDVPYR STVPGVAHAC 
GHDVHTTVAL GAGLALAEVA RVSTLPGTVR LVFQPAEELM PGGALDIIDA GVLKPVTTAI 
ALHCDPALDL GMIGLRTGPI TSAADAVEIT LAGPGGHTSR PQNTVDLVYA LVRLAADLPA 
ALGRLVDPRS ALSLVWGQVQ AGTVANAIPR TGQLRGTVRT LSRETWESVP ALVTQVAEQL 
VAPYGAQIVV DYRRGVPPVV NSVDVVEVLR TVVDRVFGHG ASTMVAQSLG GEDFGWYLNH 
VPGALARLGT RTPGGHTYDL HQGSFDVDER AIGVGVKLLA GAALDLLTHT PPAP