Gene Haur_0603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0603
Symbol
ID	5732501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	693956
End bp	695263
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	51%
IMG OID	641277730
Product	FolC bifunctional protein
Protein accession	YP_001543379
Protein GI	159897132
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCAAA CATATCAAGA TGCCATGGAT TGGATCTACA GTTTCCTCGA TAGCGAGAAG 
AAGTTACCCA AAAATCCGAC CGAATTTAAT TTGCCCCGGG TCAAGGCGAT GCTGGAGTTG 
TTGGGTAATC CACAGTTGCG CTATCCGGCG GTGATTGTGG CTGGCACGAA GGGCAAAGGT 
TCAACGTGTG CCTTTTTAGA GTCGATTATC CGCCAGAGTG GCCTAAAAGT TGGCTTTTTT 
AGCTCGCCGC ACCTACACTC CTACCGCGAA CGCATGCAAA TCAATCGTGA GCTAATTAGC 
CAAAGCCAGC TTGTCGATTT GATTAATCAG GTGCGACCGC TACTGGAGCC ACTTGACCCC 
GAAGTTGGTT CACCAACCAC CTATGAAATT GGGGTGGTTT TGGGTTTGTA CTACTTTGCT 
ACGCAGGCAA TCGAGTTGGC AGTACTTGAA ATTGGCTTGG GTGGGCGCTA TGATGCGATT 
AACACTGTTA ACCCTGTGCT CAGCGTAATT GCTTCGATCA GCTATGATCA CACGGCGATT 
TTAGGCGATA CACTAGCCAA AATTGCCTAT GAAAAGGCTG GAATCATCAA GCAGCATGTG 
CCAGTAATTA GCACTGTGCA GCAAGCCGAG GCGGCTGAGG TGATCGCTCA GGTTGCTGCT 
GAGCAAGCGG CTCCGTTATT TATTGCAGGG ATGGCGGGAT TGCAGGAGCA AGCCTCAGGG 
GTGGTTGCTG AATATCCACT GGTGATTGTG CCTGAACAAC TGGGCTTGAA GGGTGAGTTT 
CAGATGCAAA ATGCCCAACT TGCCACCAGC GCCGCATTGC TCTTGCGCGA ACTCGGTTTC 
CCCATTAGCG ATGATGCTAT TCGCCAAGGT TTGGCAACAA CCCAATGGCC TGCTCGGTTT 
GAGCAAATTG CCAACGAACC GTTGACGCTT GTCGATGGAG CGCATAACGG CGATTCGGCG 
CGGGTGCTGC TGCAAGCGCT CAAACAGAAT TATTCAAACC GACCGCTGAC CTTAGTTTTA 
GGCACATCAA GCGACAAAGA TATTCAAGCA ATTATTCAGC AACTCAGCAA TTCGGCAACC 
CACCTGATCA CAACCTGTTC GCGGCATCCA CGGGCTTTAG CACCCGAAAA ACTGGCTGAA 
TTGATTCAGC AGCATGTTAA TCGCCCGGTT CATCAGACCA ACAGCGTGGC CGAGGCCTTA 
ACGCTGGCCC AACAACTCAC ATCCGCCGCT GGCCTCATTT GCGTAACTGG ATCGCTGTTT 
GTGGCTGCCG AAGCGCGTGA AACCCATGGC TTAGCCCAGC CCGATTAG

Protein sequence

MLQTYQDAMD WIYSFLDSEK KLPKNPTEFN LPRVKAMLEL LGNPQLRYPA VIVAGTKGKG 
STCAFLESII RQSGLKVGFF SSPHLHSYRE RMQINRELIS QSQLVDLINQ VRPLLEPLDP 
EVGSPTTYEI GVVLGLYYFA TQAIELAVLE IGLGGRYDAI NTVNPVLSVI ASISYDHTAI 
LGDTLAKIAY EKAGIIKQHV PVISTVQQAE AAEVIAQVAA EQAAPLFIAG MAGLQEQASG 
VVAEYPLVIV PEQLGLKGEF QMQNAQLATS AALLLRELGF PISDDAIRQG LATTQWPARF 
EQIANEPLTL VDGAHNGDSA RVLLQALKQN YSNRPLTLVL GTSSDKDIQA IIQQLSNSAT 
HLITTCSRHP RALAPEKLAE LIQQHVNRPV HQTNSVAEAL TLAQQLTSAA GLICVTGSLF 
VAAEARETHG LAQPD