Gene Arth_2838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2838
Symbol
ID	4444670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3192984
End bp	3194204
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	61%
IMG OID	639690660
Product	aminotransferase AlaT
Protein accession	YP_832317
Protein GI	116671384
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00546919
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAAT TCAAGCAGTC CACCAAGCTT CATAATGTCC TCTACGACAT CCGTGGACCG 
ATTCTTCAGG CCGCCCAGCA GATGGAGGCA GAGGGTCACC GGATCCTCAA ACTGAACATC 
GGAAACCCGG CACCGTTTGG TTTTGAAGCG CCGGACGCGA TCCTGGTGGA CATGATCCGC 
CATCTGCCGC ACGCCCAGGG CTACAGTGAC TCCCGGGGCA TATTCTCCGC CCGGACGGCA 
GTGTCGCAGT ACTACCAGAC CCGCGGTATC CAGAACATTC ACGTGGACGA CATTTACCTC 
GGCAACGGCG TCAGCGAGCT CATCACCATG TCGCTCATGG CGCTCCTCGA CGACGGCGAC 
GAGGTTCTGA TCCCCACGCC CGACTACCCG CTCTGGACCG CCTCCGTCGC CCTCGCAAGC 
GGTCGCCCGG TGCACTACCT CTGTGATGAG GAGTCCGGCT GGCAGCCGGA CCTGGAGGAC 
CTCGAATCCA AGATCACCCC GCGAACCAAG GGAATCGTGG TGATCAACCC GAACAACCCC 
ACCGGTGCGG TGTATCCCGA GGAGACCCTC AAGAAGATTG TGGCCCTGGC TGAGAAGCAC 
GGCCTGGTCC TTTTTGCGGA TGAAATCTAC GAGAAGATCC TGTACGAGGA CGCTGTCCAC 
GTGAACCTGG CCGGACTCAC CGGCGACGAC GTCCTGTGCC TGACCTTCAG CGGGTTGTCC 
AAGGCATACC GCGTGTGCGG GTACCGGGCC GGCTGGATGG CGATCTCCGG GCCAAAGAAG 
GACGCGGCCG ACTACCTCGA AGGCATCAGT CTCCTTGCAA ACATGCGCCT GTGTGCCAAC 
GTGCCTGCCC AGCATGCCAT CCAGACGGCA TTGGGCGGAT ACCAGAGCAT CAATGATCTG 
ATCCTGCCAG GGGGCCGCCT GCTGGAACAG CGGAACAAGG CCTACGACCT GCTCAACGCC 
ATCCCCGGCG TCAGCACGCA GCAGGCCAGG GGAGCGCTGT ACCTGTTCCC GAAACTGGAC 
CCCGAGGTCT TCCACATCCG GGACGACGAA AAGTTCGTCC TGGACCTGCT CCGTGAGCAG 
AAGATCCTCG TTTCCCACGG CCGCGCCTTT AACTGGGTCC GTCCGGATCA CTTCCGGATG 
GTCACCCTGC CCAACGTGAA GGATATAGAA GAAGCAATCG GCCGTATGGG GGACTTCCTG 
AGCCGGTACC AGGGGAACTA G

Protein sequence

MAEFKQSTKL HNVLYDIRGP ILQAAQQMEA EGHRILKLNI GNPAPFGFEA PDAILVDMIR 
HLPHAQGYSD SRGIFSARTA VSQYYQTRGI QNIHVDDIYL GNGVSELITM SLMALLDDGD 
EVLIPTPDYP LWTASVALAS GRPVHYLCDE ESGWQPDLED LESKITPRTK GIVVINPNNP 
TGAVYPEETL KKIVALAEKH GLVLFADEIY EKILYEDAVH VNLAGLTGDD VLCLTFSGLS 
KAYRVCGYRA GWMAISGPKK DAADYLEGIS LLANMRLCAN VPAQHAIQTA LGGYQSINDL 
ILPGGRLLEQ RNKAYDLLNA IPGVSTQQAR GALYLFPKLD PEVFHIRDDE KFVLDLLREQ 
KILVSHGRAF NWVRPDHFRM VTLPNVKDIE EAIGRMGDFL SRYQGN