Gene Francci3_3650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3650
Symbol
ID	3905331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4360243
End bp	4361493
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	74%
IMG OID	637880973
Product	aminotransferase, class V
Protein accession	YP_482731
Protein GI	86742331
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTACC TCGACCACGG GGCGACGACG CCGATGCGAC CGGAAGCGCT CGCCGCGTAC 
ACCGCGGTGC TCGCCGATAC CGGCAATGCC TCGTCGCTGC ATGCCAGTGG CCGCCGTGCC 
CGCCGCATCG TCGAGGAGTC CCGCGAGACA CTCGCCGGAG TGCTGGGCGC CCGTCCGTCC 
GACGTGGTGT TCACCGGAGG CGGTACCGAA AGTGACAACC TCGCCCTGAA GGGTCTGTAC 
TGGTCACGCC GCCGGGCCGA ACCGGGCCGG CGGCGGGTGC TGGTCAGCGC CGTCGAGCAC 
CGGGCGGTCC TGGACACCGT CGACTGGCTC GGCCGGGCGC AGGATGCCGA GGTCGAGCTG 
CTCGCGGTCG ATGCCGCGGG AACCGTGCGG CCGGACACCC TCGCCGCCGC CCTCGAACGG 
GATCCGGACT CGGTGGCCGT CGTGTCGGTG ATGTGGGCGA ACAACGAGGT CGGCACCGTT 
CAGCCGATCG CCGAGCTCGC GACGATCGCG CACCGTCACG GCGTGCCCTT CCACACCGAT 
GCGGTGCAGG CGTTCGGCCA GATCCCGATC GCCGTCACCG ACGAGGGCCC CGACGCCATC 
ACGGTCAGCG CGCACAAGAT CGGGGGGCCG ATCGGTGTCG GTGCCCTGGT GGTGCGCCGG 
GGATTGGCGA TGGAGCCGCT GACCCACGGC GGCGGTCAGG AGCGCGACAT CCGGTCCGGA 
ACGTTGAACA CGGCCGGGGT GGCGGCGTTC GCGGCGGCCG CGGCGAGGGC ATGCGCCGAG 
GCGCCGCAGG AGAGCGTCCG GCTGGCGGCC CTGCGTGACG ACTTGGTGCG CCGGGTCCGG 
GCGGAGGTCC CGGAGGCGGT GCTCAACGGT GCCCCGCTGC TCGGGGACGG CGGCGGTGGG 
GACGGCGGCG GTGGGGACGG CGGCGGTCCG GGACCGCACC GGCTGCCGGG AAACGCCCAT 
CTGACCTTCC CCGGCTGCGA GGGAGACTCG CTGCTGATGC TGCTCGATGC CCGGGGGATC 
GAGTGTTCCA CCGGCTCGGC CTGCTCCGCT GGAGTGGCGA GGCCGTCGCA CGTGTTGCTC 
GCGATGGGAG TGGATGAGGC ACACGCCCGC GGATCGCTGC GGTTCTCCCT CGGGCACACC 
TCACGGGCCT GCGACATCGA CGCGCTGGTC GCGGCGATCG GGCCGGTCGT CGAGCGGGCG 
AGCCGCGCGG GGGCGCTGGC CGGCACGAGC GGCAGCATGA GCGGCACCTG A

Protein sequence

MTYLDHGATT PMRPEALAAY TAVLADTGNA SSLHASGRRA RRIVEESRET LAGVLGARPS 
DVVFTGGGTE SDNLALKGLY WSRRRAEPGR RRVLVSAVEH RAVLDTVDWL GRAQDAEVEL 
LAVDAAGTVR PDTLAAALER DPDSVAVVSV MWANNEVGTV QPIAELATIA HRHGVPFHTD 
AVQAFGQIPI AVTDEGPDAI TVSAHKIGGP IGVGALVVRR GLAMEPLTHG GGQERDIRSG 
TLNTAGVAAF AAAAARACAE APQESVRLAA LRDDLVRRVR AEVPEAVLNG APLLGDGGGG 
DGGGGDGGGP GPHRLPGNAH LTFPGCEGDS LLMLLDARGI ECSTGSACSA GVARPSHVLL 
AMGVDEAHAR GSLRFSLGHT SRACDIDALV AAIGPVVERA SRAGALAGTS GSMSGT