Gene Francci3_0064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0064
Symbol
ID	3905399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	80424
End bp	81671
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	68%
IMG OID	637877394
Product	aminotransferase AlaT
Protein accession	YP_479187
Protein GI	86738787
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTTCA CCCAGTCCGA CAAGCTCGCC GACGTCTGCT ACGACGTCCG TGGGCCTGTC 
CTCGACGAAG CGACCCGGCT GGAAGCTGCG GGGTCGCGCA TCCTCAAGCT GAACATCGGC 
AATCCCGCGC CGTTCGGCTT CTCCGCACCG CCGGAGGTAC TCGAGGCCGT CGTGGCAAAC 
CTTGCGGATG CACAGGGTTA CAGCGACTCC AAGGGACTAC TCGCCGCCCG GGAAGCGGTC 
GTGCGCTATC ACCTCCGCAA GGGGGTCACC GGCATCGACC CCGGCGGGGT CTACCTCGGC 
AACGGCGTCT CCGAACTGAT CATGATGTCG TTGCAGGCGT TGCTCAACAA CGGCGACGAG 
GTGCTGCTCC CCGCGCCCGA CTATCCACTG TGGACGGCCG TGGTCAGCCT GTGCGGTGGC 
CGGCCCGTGC ACTACCTCTG CGACGAGTCC GCCGGCTGGG CGCCCGACCT CGACGACATC 
GCCGCCAAGG TCACCCCGCG GACACGAGCG ATCGTCGTCA TCAACCCGAA CAACCCGACT 
GGTGCCGTCT ACGACCGGCA GGTGCTGGAG AACATCGTCG AGGTCGCCCG CCGCCACCAC 
CTGATGCTGC TGTCCGATGA GATCTACGAC CGGATCCTCT ACGAGGACGC CGAGCACATC 
GCGACCGCAG CGCTCGCGCC GGACCTGGTC TGCATGACCT TCAACGGGCT GTCGAAGTCC 
TATCGGCTGG CCGGGTTCCG GGCCGGGTGG ATGGTGATGT CCGGTCCGCG CGGCCACGCC 
TCGAGCTACA TCGAGGGAGT GAACATCCTC GCGAACATGC GCCTGTGCGC CAACGCGCCC 
GGGCAGTTCG CCACGGTCGC CGCCCTCACG GAGGACGGCG GCGCAGGGGA CCTCGTCCTG 
CCCGGCGGCC GGCTGCGCGA ACAACGAGAC ACGGTCGTGA AGCTCCTCAA CGACATCCCC 
GGGGTGTCGT GCGTCCCGCC GCGGGGGGCG CTGTACGCCT TCCCCCGGCT GGACCCCGCC 
GTCTACCCGA TCCGGGACGA CGAGCGCTTC GTCCTCGATC TGCTGTTGGC CGAGAAGATC 
CTGCTCGTCC AGGGCAGCGG CTTCAACTGG CCGCATCCCG ACCATGTCCG GATCGTGACC 
CTGCCCGCGG TGGACGATCT CACGGACGCC ATCGGCCGGA TCGATCGCTT CCTGGCCTCC 
TACAAACGCC CCTCCCAACA ACAGTGCCCC TCCCAACGAC GGAACTGA

Protein sequence

MEFTQSDKLA DVCYDVRGPV LDEATRLEAA GSRILKLNIG NPAPFGFSAP PEVLEAVVAN 
LADAQGYSDS KGLLAAREAV VRYHLRKGVT GIDPGGVYLG NGVSELIMMS LQALLNNGDE 
VLLPAPDYPL WTAVVSLCGG RPVHYLCDES AGWAPDLDDI AAKVTPRTRA IVVINPNNPT 
GAVYDRQVLE NIVEVARRHH LMLLSDEIYD RILYEDAEHI ATAALAPDLV CMTFNGLSKS 
YRLAGFRAGW MVMSGPRGHA SSYIEGVNIL ANMRLCANAP GQFATVAALT EDGGAGDLVL 
PGGRLREQRD TVVKLLNDIP GVSCVPPRGA LYAFPRLDPA VYPIRDDERF VLDLLLAEKI 
LLVQGSGFNW PHPDHVRIVT LPAVDDLTDA IGRIDRFLAS YKRPSQQQCP SQRRN