Gene Arth_2901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2901
Symbol
ID	4444423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3267244
End bp	3268941
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	67%
IMG OID	639690724
Product	formate--tetrahydrofolate ligase
Protein accession	YP_832380
Protein GI	116671447
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGACA ACAACGTCAT GAGTGACCTG GAAATCGCCC AGCGCGCCAC CATGCGCCCC 
ATCGGTGACA TCGCCGCCGC GGCAGGCATC AACGCCGACG CCGTGGAACT CTATGGCCGG 
TACAAGGCGA AAATCGATCC GGCGAAGCTT ATAGATCCGG CAGGGGCACC GAAGCGCCTG 
CCGGGCAAGG TGGTGCTCGT CTCCGCGATG TCCCCCACTC CGGCGGGCGA GGGGAAGTCC 
ACCACCACGG TGGGTCTGGC GGATTCCCTC GCCCGGGCGG GCCGGAACGT GATGATTGCG 
CTGCGTGAGC CGTCCCTGGG TCCCGTTCTT GGGATGAAGG GCGGGGCCAC CGGCGGAGGC 
TACTCCCAGG TGCTGCCCAT GGAGGAAATC AACCTGCACT TCACGGGCGA CTTCCACGCC 
ATCACCTCGG CGAACAACGC GCTCATGGCC CTGGTGGACA ACCATATTTT CCAGGGCAAC 
GAACTCAACA TCGATCCCCG CAGGATGACC TTCAAACGGG TCCTCGACAT GAACGACCGC 
TCCCTCCGCG AAGTGATCAT CGGCCTCGGC GGTCCGGCCC AGGGCGTCCC GCGGCAGGAC 
GGCTTCGACA TCACCGTGGC TTCGGAGATC ATGGCGGTCT TCTGCCTGGC CACGGACATC 
GCCGATCTCC GTGCCCGGCT GGGCCGCATC ACCTTCGGCT ATACCTATGA CCGCGAACCC 
GTCACGGTGG CGGACCTCGG GGTCCAGGGT GCACTGACCA TGCTGCTCAG GGATGCGATC 
AAGCCCAACC TCGTGCAGAC CATCGCCGGC ACTCCGGCCC TGGTGCACGG CGGCCCGTTT 
GCCAACATCG CACACGGCTG CAACTCGCTG ATCGCCACCC AGACCGCCCG CCGGCTCGCG 
GACATCGTGG TCACCGAAGC CGGCTTCGGC GCAGACCTGG GCGCGGAAAA GTTCATGGAC 
ATCAAGGCGA GGGTGGCAGG CGTGGCGCCG TCCGCCGTCG TGCTCGTGGC AACCGTACGG 
GCGCTGAAGA TGCACGGCGG TGTGGCCAAG GACCGGCTGC AGGAGCCCAA CGTGGAGGCG 
CTGGCCGCCG GATCGGCAAA TCTCCGGCGG CACATCCGCA ACGTGGAGAA GTTCGGAATC 
ACTCCCGTGG TGGCCGTCAA CAAGTTCGCC ACTGACACCC CGGAGGAGTT GGACTGGCTG 
CTGGAGTGGT GCGCCGGCGA AGGGGTGCAG GCCGCGGTGG CAGACGTCTG GGGTCGCGGC 
GGCGGCGGCG ACGGCGGCGA CGAGCTCGCG GCCAAGGTGC TCGCGGCGCT CGAGGCGCCG 
CACAGCTTCC GGCACCTCTA CCCGCTGGAG CTGTCTGTGG AGGACAAGAT CCGCACCATC 
GTGCAGGAAA TGTACGGGGC CGACGGCGTG GACTTCTCCG TTCCCGCCCT CAAGCGCCTT 
GCCGAAATCG AGAAGAACGG CTGGGCCGGC ATGCCCGTCT GCATGGCCAA GACCCAGTAC 
TCCTTCAGTG ACGACGCCAC CCGCCTGGGC GCACCGAAAG GCTTCACGGT CCATGTACGG 
GACCTCATCC CCAAGACCGG GGCGGGTTTC ATCGTGGCCC TGACCGGCGC GGTGATGACG 
ATGCCGGGTC TGCCCAAGGT TCCGGCAGCC CTGCGGATGG ACGTGGACGA CACCGGCAAG 
CCCCTCGGCC TCTTCTAG

Protein sequence

MSDNNVMSDL EIAQRATMRP IGDIAAAAGI NADAVELYGR YKAKIDPAKL IDPAGAPKRL 
PGKVVLVSAM SPTPAGEGKS TTTVGLADSL ARAGRNVMIA LREPSLGPVL GMKGGATGGG 
YSQVLPMEEI NLHFTGDFHA ITSANNALMA LVDNHIFQGN ELNIDPRRMT FKRVLDMNDR 
SLREVIIGLG GPAQGVPRQD GFDITVASEI MAVFCLATDI ADLRARLGRI TFGYTYDREP 
VTVADLGVQG ALTMLLRDAI KPNLVQTIAG TPALVHGGPF ANIAHGCNSL IATQTARRLA 
DIVVTEAGFG ADLGAEKFMD IKARVAGVAP SAVVLVATVR ALKMHGGVAK DRLQEPNVEA 
LAAGSANLRR HIRNVEKFGI TPVVAVNKFA TDTPEELDWL LEWCAGEGVQ AAVADVWGRG 
GGGDGGDELA AKVLAALEAP HSFRHLYPLE LSVEDKIRTI VQEMYGADGV DFSVPALKRL 
AEIEKNGWAG MPVCMAKTQY SFSDDATRLG APKGFTVHVR DLIPKTGAGF IVALTGAVMT 
MPGLPKVPAA LRMDVDDTGK PLGLF