Gene Haur_5021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_5021
Symbol
ID	5736980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009973
Strand	+
Start bp	28031
End bp	29050
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	641282188
Product	RimK domain-containing protein ATP-grasp
Protein accession	YP_001547779
Protein GI	159901533
COG category	[H] Coenzyme transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0189] Glutathione synthase/Ribosomal protein S6 modification enzyme (glutaminyl transferase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.548903
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCTTG TTCTCACCAG TCCAGATGAT ACTCATGCTG ATCGGGTCTG TGATCTGCTG 
GACCAAGCCG ATGCTCCTTG GTTTCGGTTC GATCCGGCCG CCTTTCCCCA CTCTGCCCAG 
TTGACCGTGA CCACGGGCGC AACGGGCTTG GTCCAGCGTC TCCTTGTTAC GAGAGATCAT 
AGCCTAGATT TGGCGCAGGT CACAGCGCTC TGGTACCGCC GTCCCCAAGC ACCAGTGGTG 
GAAGTGCCAG GGATCGACCC ATCTCATAAT GCGGCGTTGG CGGAAGAATG CCAACACTTG 
GTTCGTGATC TATGGGAGAC ATTGGCGTGC TTGATGGTGC CGGCATCGTA CTGGGTTATC 
CAGCGAGCAC AACACAAGAT CTCCCAACTT CAGTTGGCCA CAGCCCTGGG GTTTGAACTC 
CCGCCAACAA TGGTCACCAA TGACCCATCG GCACTGATCG CTTTCTCTCG CGCCCACAAT 
GGGCAAATCA TTAGCAAACC GTGTATGGGA CTCGCCCTGC AACGGACGGG CTACTATCAA 
TACACACGTC CCGTCACCCG CCGAGACCTT GCTGCAGCCG AGACCATTCA CGCATCGCCC 
ATGATTTTCC AGAAACTGGT GCCTAAGGCG GTTGAGGTAC GCATCACCGT TGTCGGCGAT 
CAGGTATTTG CCGTCGCGAT CCACTCCCAG GTCTCCCATC ATACCCGCTA TGACTGGCGG 
CGCTACGACC ATGATCATAC GCCGCTTACA CCGCATACCC TGCCCCCCGC ACTGGCGGCC 
CAGTGTGTGG CACTGGTGGC TCGCATGGGC CTGACCTACG GAGCCATTGA TATGATTCTT 
ACGCCTAACG GACGATATAT CTTTTTGGAA ATCAATCCTA ATGGACAGTA TCTTTGGGTT 
GAATCCCGCA CCGGCGTTCC TATCAGCGCG GCCATCGCCC GTCTGCTCCA GACCGGCACC 
CACCGCACTG TCGCCAATCT AGTCGTGTCC GAGGGAGGAA TAGCATGCCT CCTGGAGTAA

Protein sequence

MILVLTSPDD THADRVCDLL DQADAPWFRF DPAAFPHSAQ LTVTTGATGL VQRLLVTRDH 
SLDLAQVTAL WYRRPQAPVV EVPGIDPSHN AALAEECQHL VRDLWETLAC LMVPASYWVI 
QRAQHKISQL QLATALGFEL PPTMVTNDPS ALIAFSRAHN GQIISKPCMG LALQRTGYYQ 
YTRPVTRRDL AAAETIHASP MIFQKLVPKA VEVRITVVGD QVFAVAIHSQ VSHHTRYDWR 
RYDHDHTPLT PHTLPPALAA QCVALVARMG LTYGAIDMIL TPNGRYIFLE INPNGQYLWV 
ESRTGVPISA AIARLLQTGT HRTVANLVVS EGGIACLLE