Gene Apar_0621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0621
Symbol
ID	8413481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	698372
End bp	700045
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	48%
IMG OID	645022199
Product	Formate--tetrahydrofolate ligase
Protein accession	YP_003179642
Protein GI	257784425
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.164812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.927809
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAGG TTAAATCCGA TATTGAGATT GCTCAATCAT CCGAGATGCT TCCCATCTTT 
GAGGTGGCAA AGCGCGCGGG TATTTCAGAG GATCTTCTCG AGCCTTATGG TCGCTATAAG 
GCAAAGCTTG ATGCACGTGC TCTGGCAGAT AAGCCTCTTC GCGGAAAGCT TGTGTTGGTA 
ACAGCCATTA ATCCAACTCC AGCAGGTGAG GGAAAGACCA CCACTTCAGT TGGCTTAGCA 
GATGCTTTGA CTAGCCTTGG TCAGTCTGCC ATGTTAGCGC TTAGGGAGCC TTCCTTGGGT 
CCTGTCTTTG GCGTCAAAGG TGGTGCTGCG GGCGGTGGAT ATGCCCAGGT AGTTCCTATG 
GAAGATATTA ATCTCCACTT TACTGGTGAC TTCCATGCTA TTGGTGCTGC AAACAACCTT 
TGTGCAGCTA TGTTGGATAA TCATATCAAA CAGGGCAACA GCCTTAACAT TGATCCACGA 
CGCATTGTGT GGAAGCGCTG CGTTGACATG AACGATCGCC AGCTCAGAAA CGTTGTTGAT 
GGTCTTGGTG GCATTGCAGA TGGTATGCCA AGACAAGACG GCTTTGATAT TACCGTTGCT 
TCTGAGGTTA TGGCGGTATT CTGCCTTGCT TCGGGTATCA AAGACCTTAA AGAGCGCCTG 
GGTAGAATGG TTATTGCTTA CACCTATGAC CGCAAGCCTG TTACTGTAAG TGATATCCAC 
GCAGAGGGTG CTATGACAGC GCTGCTCAAA GACGCTATTC AGCCTAACCT GGTTCAGACG 
CTTGAGCATA CACCTGCGCT TGTCCACGGT GGTCCTTTTG CCAATATTGC TCATGGCTGC 
AATACCGTTG AGGCAACAAA GACCGCTTTG CGTCTTGCTG ATTACGTTGT TACTGAGGCC 
GGCTTTGGTG CAGATCTTGG TGCCGAGAAG TTCTTGGACA TCAAGTGCAG AGCTACAGGC 
CTTGCTCCAT CAGCTGTTGT TCTGGTGGCA ACAGTTCGTG CTCTTAAGTA CAACGGAGGC 
GTTGCCAAGG CAGACCTTAA TCAACAAAAC GTTGAGGCGC TTAAAGAGGG CATTCCTAAT 
TTGCTTCGCC ATGTTGACAA CATCCAGACG GTCTATGGAC TTCCTGTAGT TGTTGCTATC 
AATGCATTCC CAACTGATAC CGCTGAAGAG CTTGCTCTGG TAGAGGAGGA GTGCAAGAAG 
CGCGGTGTTA ACGTAGTGTT GTCTGAGGTT TGGGCAAAGG GTGGAAAGGG TGGTCAGGCT 
TTAGCAGAAG AGGTCATGCG TCTTTGTCAG ACTGAGTCTA AGCTCACTTT TGCTTACGAC 
GTCAAAGAGT CTTTGAAGCA GAAGATTACT GACATTGCTA CTAAGATTTA CCACGCCGAT 
GGCGTTGAAT TTACTCCAAG CGCCGCTAAG CAGCTTCAGC AGCTTGAAGA GCTTGGCTTT 
GGCGAGCTTC CTATTTGTAT GGCAAAAACA CAGTACTCAT TTACTGATGA CCAGACCAAA 
TTGGGTGCTC CAGAAAACTT TAGGATTACT GTGCGAGAAG TTCGTGTTTC TGCAGGCGCT 
GGCTTTGTGG TCTGTCTTAC TGGTTCTATT ATGACCATGC CAGGACTTCC AAAGGTTCCT 
GCTGCAGAAC ACATTGATGT TCTTGATGAT GGAAGAATAG TGGGTCTTTT CTAA

Protein sequence

MSEVKSDIEI AQSSEMLPIF EVAKRAGISE DLLEPYGRYK AKLDARALAD KPLRGKLVLV 
TAINPTPAGE GKTTTSVGLA DALTSLGQSA MLALREPSLG PVFGVKGGAA GGGYAQVVPM 
EDINLHFTGD FHAIGAANNL CAAMLDNHIK QGNSLNIDPR RIVWKRCVDM NDRQLRNVVD 
GLGGIADGMP RQDGFDITVA SEVMAVFCLA SGIKDLKERL GRMVIAYTYD RKPVTVSDIH 
AEGAMTALLK DAIQPNLVQT LEHTPALVHG GPFANIAHGC NTVEATKTAL RLADYVVTEA 
GFGADLGAEK FLDIKCRATG LAPSAVVLVA TVRALKYNGG VAKADLNQQN VEALKEGIPN 
LLRHVDNIQT VYGLPVVVAI NAFPTDTAEE LALVEEECKK RGVNVVLSEV WAKGGKGGQA 
LAEEVMRLCQ TESKLTFAYD VKESLKQKIT DIATKIYHAD GVEFTPSAAK QLQQLEELGF 
GELPICMAKT QYSFTDDQTK LGAPENFRIT VREVRVSAGA GFVVCLTGSI MTMPGLPKVP 
AAEHIDVLDD GRIVGLF