Gene Franean1_0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0949
Symbol
ID	5669363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1111392
End bp	1112813
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	71%
IMG OID	641239877
Product	aminotransferase class-III
Protein accession	YP_001505311
Protein GI	158312803
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.762342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.330894
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGTGT CCAACGCGAC GACCACGACT CCTCGTCCCG GTGACCCGCC GCGGACTGGG 
CACGCCGGGC GGGTGACCGA TCTCCTCGAG CGGGAGGAGC GCGCGCTGCA GGCCCGCACT 
CCGGCGTCCG AGGCCATGCA CACCCGTGCC CTGCGGACGA TGACCGGCGG GGTCCCGTCC 
TCCTACCAGC TGCGCGACCC CTGGCCGATC TACCTCACGC ACGGCCGCGG CTCGCTGGTC 
TGGGACGTCG ACGGCAACGA GTACTCCGAC TTCCACAACG GGTACGGCTC GATGGTTCAG 
GGCCACGCCC ACCCCGCGAT CGTGCGCGCG GTGACCGAGC GGATGGCGCT CGGCTCGCAC 
TTCGCCATGC CCACCGAGGA TTCGGTGCTG GTCAGCGAGG AGCTGGCCCG CCGCTTCGGG 
CTGCCGCAGT GGCGTTACGT CAACTCCGGC TCCGAGGCGA CCATGGACGC CATCCGCATC 
GCCCGCGGGG TGACCGGCCG GGACACCATC GTCAAGATCT TCGGCTCGTA CCACGGCCAT 
CACGACTACG TGATGGTCTC GATCGGCACC CCCTACGGGG ACATCGGGCC GGCGGACCAT 
ATGAACTCCC TGGCCTACGG CGCGGGAATC CCGCAGGCGG TGGTCGACCT GACGGTGCCC 
GTGCCGTTCA ACGACGCGGC GGCGATGGAA CGGCGGATCG CCGCGCTCGA GGCCGAGGGG 
CGCAAGCCCG CCTGTGTGAT CATGGAGGCG GCGATGATGA ACCTCGGCGT CGTCCTGCCC 
GAGCCGGGCT ACCTGGAGGC CGTCCGGGAG ATCACACGCA GGCACGGCAT CGTGCTCATC 
TTCGACGAGG TCAAGACCGG GCTGTGCGTC GCGGCCGGCG GCGCCGTCGA GCGGTTCGGG 
GTGCTGCCCG ACATGGTCAC CCTCGCCAAG GCGCTCGGCG GCGGACTGCC GGCCGGCGCG 
ATCGGCGCCA CCGCGGAGCT GATGGCCGCG GTCGCCGAGG ACAGGGTGAA ACAGGTGGGG 
ACCTTCAACG GCAACCCGCT GGTCATGGCG GCGGCGCGGG CCAGCCTGAC CGAGGTCCTG 
ACCCCGGACG CCTACGCCCA CCTCGACCGC CTCAACGACC GCCTGGTGGA CGGCTGCACC 
GCGATCCTGG CCCGCCACGG CATCGCCGGC TACGCCGTCG GGATCAGCTC GAAGGGATGC 
GTCCACTTCA CCGACGCCCC GATCCGGGAC TACACGTCCT TCATGGCCCA CCAGAACGCG 
GTCCTGCCGG AGCTGGCCTG GCTCTACAAC GCCAACCGGC AGGTGCTGAT GGCCCCCGGC 
CGGGAGGAGG AGTGGACGCT GTCCGTCCAG CACACCGACG CCGACGTCGA CCGCTACCTG 
GCGAGCCTCG ACGCGATGGC CGCGGACCTC GCCCGCGGCT GA

Protein sequence

MTVSNATTTT PRPGDPPRTG HAGRVTDLLE REERALQART PASEAMHTRA LRTMTGGVPS 
SYQLRDPWPI YLTHGRGSLV WDVDGNEYSD FHNGYGSMVQ GHAHPAIVRA VTERMALGSH 
FAMPTEDSVL VSEELARRFG LPQWRYVNSG SEATMDAIRI ARGVTGRDTI VKIFGSYHGH 
HDYVMVSIGT PYGDIGPADH MNSLAYGAGI PQAVVDLTVP VPFNDAAAME RRIAALEAEG 
RKPACVIMEA AMMNLGVVLP EPGYLEAVRE ITRRHGIVLI FDEVKTGLCV AAGGAVERFG 
VLPDMVTLAK ALGGGLPAGA IGATAELMAA VAEDRVKQVG TFNGNPLVMA AARASLTEVL 
TPDAYAHLDR LNDRLVDGCT AILARHGIAG YAVGISSKGC VHFTDAPIRD YTSFMAHQNA 
VLPELAWLYN ANRQVLMAPG REEEWTLSVQ HTDADVDRYL ASLDAMAADL ARG