Gene Arth_1212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1212
Symbol
ID	4446308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1320179
End bp	1321381
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	63%
IMG OID	639689019
Product	transglycosylase domain-containing protein
Protein accession	YP_830706
Protein GI	116669773
COG category	[S] Function unknown
COG ID	[COG3583] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0852875
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCGTTT TTCCCCGTGC CCGGATGGTC CTAGAGTTAC GGGCAATCGT GGTCAAGTTC 
TTCACTTCGG ACGGTAAGTT CAGTTTCGTC AAGGTCGGTG CCCAGCTGGT TGTGCTCTCT 
GCACTCGTGC TGGGCCTGGT GGCCTTCGTA GGCAACAACA AAACAGTCAC CCTGAATGTG 
GACGGGAAAG TCAGCTCCGT CCAGACGTTC GGCGGGACGG TAGGCCAAGT GGTCAAAAGT 
GCCAAGGTGG AGCTGCAGGC CGCGGACCGG GTTTCCCCGT CGGCGGACGC CCGCGTGGAG 
GATGGCTCGG TCATCAACGT CAATCTCGCC AAGGCAGTGA AGATCAGCCT CGACGGCGCT 
GAGAAGACGA TCAACACAAC CTCTGCCAAC GTCGAAGGAC TGGTCACCGA ACTCGGCGTT 
GCCAGTGCCT CGGAAGTCTC CGCGCCAAAG GACGCCCAGC TGGCCGTCTC CGGTTCGTTT 
GTGGCCATCT CCACGCCCAA GACCGTCAGC ATCCTGGCGG ACGGCAAGGC GTCGAAGACA 
ACCACCACGG CTTCAACCGT GGCGGAGGTC CTCAAGGACG CCGGAGTGAC CGTGGGTGCC 
GGTGACCGGC TTTCCCAGCC GCGCAACGCG CACGTCGTCA ATGACATGGC GATCAAGGTC 
TCCCGGGTGG ATTCCTCCAA GACTGCCGCA ACCTCCGAAG AGGTTCCCTT CGAGACCCTG 
AGTTCCGAAA GCGCCGACCT GTTCGTCGGC GAGAAGAAGG TCACCCAGGC CGGTGTCCCC 
GGCAAGGTGG ACAAGAACTT CAAGCTGGTG CTGGTGGATG GCCGGGAAGC CTCCCGGACC 
CTCGTCTCCG AGACCGTCTC CGTCCAGCCG GTGACTGAAA AGGTCTCGGT CGGGACCAAG 
GAAAAGCCCA AGGCCGAAGC TGCCGGTGCG AACACCGGTG CAGCCGCCCC CGCCATGATG 
AATGAAGCCA TGTGGGACAA GATCGCGCAG TGCGAATCCA CCGGCAACTG GTCCATCAAC 
TCCGGCAACG GCTACTACGG CGGTCTGCAG TTCGACATCC AGACCTGGCT CGGTGCCGGA 
GGCGGCGCCT ACGCTCCCAA CGCCAGCCTT GCCACCAAGG CCCAGCAGAT CGACATCGCC 
AACCGCGTTT ACGCGCAGCG CGGCCTCTCC CCCTGGGGCT GCGGCTGGGC AGCGACCAGC 
TAA

Protein sequence

MCVFPRARMV LELRAIVVKF FTSDGKFSFV KVGAQLVVLS ALVLGLVAFV GNNKTVTLNV 
DGKVSSVQTF GGTVGQVVKS AKVELQAADR VSPSADARVE DGSVINVNLA KAVKISLDGA 
EKTINTTSAN VEGLVTELGV ASASEVSAPK DAQLAVSGSF VAISTPKTVS ILADGKASKT 
TTTASTVAEV LKDAGVTVGA GDRLSQPRNA HVVNDMAIKV SRVDSSKTAA TSEEVPFETL 
SSESADLFVG EKKVTQAGVP GKVDKNFKLV LVDGREASRT LVSETVSVQP VTEKVSVGTK 
EKPKAEAAGA NTGAAAPAMM NEAMWDKIAQ CESTGNWSIN SGNGYYGGLQ FDIQTWLGAG 
GGAYAPNASL ATKAQQIDIA NRVYAQRGLS PWGCGWAATS